智能体管弦乐队:为什么 3 名专家在生产环境胜过 1 名通才
"一个智能体包打天下"的模式已触顶。下一代靠协调多个专精智能体——隔离上下文、worktree、共享任务列表、质量门禁。灵感来自 Addy Osmani,结合 Autenticare 在 Gemini Enterprise Agent Platform 上的实战栈。
Fabiano Brito
CEO & Founder
单智能体的天花板
任何用过智能体超过半年的人都感受到过:存在一个平台期,加更多 prompt 不再带来加速。三大约束解释了这个天花板:
📚 上下文过载
真实客户代码库会超出任何上下文窗口。当智能体需要"同时记住一切"时,反而忘记关键。
🎯 缺乏专精
同时做数据库、API、UI 与测试的智能体成了"万金油"——样样通、样样松。只懂数据层的智能体写出更好的 SQL。
🚦 缺乏协调
没有协调原语(文件锁、任务依赖)的多个智能体只会带来混乱。合并冲突会吃掉所有并行收益。
指挥家 vs 总指挥
最贴切的比喻(要感谢 Addy Osmani):从指挥家——实时引导一名乐手——升级为总指挥——异步协调整支乐队。聊天线程不再是工作环境;代码仓(与任务看板)取而代之。
| 维度 | 指挥家(1 个智能体) | 总指挥(团队) |
|---|---|---|
| 模式 | 同步——等待每次回复 | 异步——你规划与审核 |
| 上下文 | 你的窗口就是上限 | N 个独立窗口,每位专家一个 |
| 吞吐 | 1×——顺序执行 | ~3×——3 个智能体并行 |
| 工作区 | 聊天线程 | 代码仓 + worktree + 任务列表 |
| 你的角色 | Prompt 录入员 | 流程工程师:规格、门禁、复盘 |
三种编排模式
生产中我们用三种模式——按任务范围而非潮流选择:
🌿 子智能体
父智能体拆解任务,委派给聚焦的子智能体,手工管理依赖图。零搭建——今天就能开始。Token 成本中性。
- 搭建
- 无
- 最佳规模
- 2–4 个
👥 智能体团队
Team Lead + 带文件锁的共享任务列表 + 点对点消息。依赖解除即自动解锁后续任务。
- 最佳规模
- 3–5 个
- 协调机制
- 任务列表 + 锁
☁️ 云端异步
分配任务,关上笔记本,回来直接看 PR。运行在托管 VM 上——我们的实现基于 Gemini Enterprise Agent Platform 的 Agent Runtime。
- 模式
- 发完即忘
- 会话
- 可达数天
瓶颈不再是生成,而是验证。人工审核不是可选开销——它是安全系统。
真正重要的数字
3 个智能体并行
超过即分散
+20% 成本(ETH 苏黎世)
右侧数字很关键:Gloaguen 等人(ETH 苏黎世)的研究显示,让智能体自己写 AGENTS.md 会降低性能约 3% 并增加成本超 20%。AGENTS.md 必须由人工策划——它编码的是团队的制度知识。
AGENTS.md:共享大脑
四个章节就够:
## STYLE
- 使用 Hooks 的函数组件;具名导出
- 错误必须类型化;不允许 `throw "string"`
## GOTCHAS
- SQLite 并发读取需要开启 WAL
- Express 中间件顺序影响 auth
## ARCH_DECISIONS
- 状态全部存 SQLite,不用内存缓存
- 每个 feature 模块一个 Express router
## TEST_STRATEGY
- HTTP 路由优先用集成测试而非单元测试
- 用 supertest 做请求断言
每次会话都读取。任何智能体都不能直接写——每一行新增都要由 lead 审核。
明天就能开始的 5 个实践
把任务拆成 2–3 个范围精确的子项。零搭建。这是内部验证理论最便宜的方式。
每个智能体独占一个 git worktree。零合并冲突——按 feature 的 diff 也极易审核。
Teammate 写计划;lead 批准或拒绝。在计划阶段修架构的成本只有代码阶段的 1/10。
在 TaskCompleted 自动校验。失败则智能体继续工作。Lead 只看到全绿代码——相当于内置 CI。
每次会话读取,lead 持续更新。模式与陷阱成为团队的长期记忆,不必每个 sprint 重新发现。
在 Autenticare 的具体落地
这套模式只有在生产基础设施到位时才闭环。这正是 Gemini Enterprise Agent Platform(4 月 22 日发布——完整分析)所交付的:
- Agent Runtime 提供云端异步模式所需的”托管 VM”——亚秒级冷启动、可持续数天的会话。
- Memory Bank + Memory Profiles 把
AGENTS.md提升为平台原语——跨会话的长期记忆。 - Agent Sandbox 是生产环境中的隔离 worktree——生成的代码在不影响真实系统的前提下运行。
并非巧合。整个行业的方向是一致的:从单次 prompt 执行迈向智能体工厂。
您不再是在写软件,而是在构建写软件的工厂。
想从单智能体升级为一支管弦乐队?
我们在 Gemini Enterprise Agent Platform 上构建 3 至 5 人的智能体团队——配套 worktree、人工策划的 AGENTS.md、质量 hook 与计划审批。可审计、可复用、可度量。
灵感来自 Addy Osmani(Google Chrome)的 "The Code Agent Orchestra"。结合 Autenticare 在 Gemini Enterprise Agent Platform 上的实战栈进行改编。
