Autenticare
智能体工程 · · 7 min

智能体管弦乐队:为什么 3 名专家在生产环境胜过 1 名通才

"一个智能体包打天下"的模式已触顶。下一代靠协调多个专精智能体——隔离上下文、worktree、共享任务列表、质量门禁。灵感来自 Addy Osmani,结合 Autenticare 在 Gemini Enterprise Agent Platform 上的实战栈。

Fabiano Brito

Fabiano Brito

CEO & Founder

智能体管弦乐队:为什么 3 名专家在生产环境胜过 1 名通才
TL;DR单个智能体结对是大多数人在做的事——也是大多数人卡住的地方。今天高产团队协调3 至 5 个专精智能体,每个拥有独立上下文,运行在隔离的 worktree 中,通过共享任务列表同步,配合自动化质量门禁。瓶颈不再是代码生成——而是验证。杠杆也不再是 prompt:而是规格说明书

单智能体的天花板

任何用过智能体超过半年的人都感受到过:存在一个平台期,加更多 prompt 不再带来加速。三大约束解释了这个天花板:

约束 1

📚 上下文过载

真实客户代码库会超出任何上下文窗口。当智能体需要"同时记住一切"时,反而忘记关键。

约束 2

🎯 缺乏专精

同时做数据库、API、UI 与测试的智能体成了"万金油"——样样通、样样松。懂数据层的智能体写出更好的 SQL。

约束 3

🚦 缺乏协调

没有协调原语(文件锁、任务依赖)的多个智能体只会带来混乱。合并冲突会吃掉所有并行收益。

指挥家 vs 总指挥

最贴切的比喻(要感谢 Addy Osmani):从指挥家——实时引导一名乐手——升级为总指挥——异步协调整支乐队。聊天线程不再是工作环境;代码仓(与任务看板)取而代之。

维度指挥家(1 个智能体)总指挥(团队)
模式同步——等待每次回复异步——你规划与审核
上下文你的窗口就是上限N 个独立窗口,每位专家一个
吞吐1×——顺序执行~3×——3 个智能体并行
工作区聊天线程代码仓 + worktree + 任务列表
你的角色Prompt 录入员流程工程师:规格、门禁、复盘

三种编排模式

生产中我们用三种模式——按任务范围而非潮流选择:

模式 1

🌿 子智能体

父智能体拆解任务,委派给聚焦的子智能体,手工管理依赖图。零搭建——今天就能开始。Token 成本中性。

搭建
最佳规模
2–4 个
模式 2

👥 智能体团队

Team Lead + 带文件锁的共享任务列表 + 点对点消息。依赖解除即自动解锁后续任务。

最佳规模
3–5 个
协调机制
任务列表 + 锁
模式 3

☁️ 云端异步

分配任务,关上笔记本,回来直接看 PR。运行在托管 VM 上——我们的实现基于 Gemini Enterprise Agent Platform 的 Agent Runtime

模式
发完即忘
会话
可达数天

瓶颈不再是生成,而是验证。人工审核不是可选开销——它是安全系统。

真正重要的数字

~3×
吞吐
3 个智能体并行
3–5
团队最佳规模
超过即分散
−3%
AI 撰写 AGENTS.md 的代价
+20% 成本(ETH 苏黎世)

右侧数字很关键:Gloaguen 等人(ETH 苏黎世)的研究显示,让智能体自己写 AGENTS.md 降低性能约 3% 并增加成本超 20%。AGENTS.md 必须由人工策划——它编码的是团队的制度知识。

AGENTS.md:共享大脑

四个章节就够:

## STYLE
- 使用 Hooks 的函数组件;具名导出
- 错误必须类型化;不允许 `throw "string"`

## GOTCHAS
- SQLite 并发读取需要开启 WAL
- Express 中间件顺序影响 auth

## ARCH_DECISIONS
- 状态全部存 SQLite,不用内存缓存
- 每个 feature 模块一个 Express router

## TEST_STRATEGY
- HTTP 路由优先用集成测试而非单元测试
- 用 supertest 做请求断言

每次会话都读取。任何智能体都不能直接写——每一行新增都要由 lead 审核。

明天就能开始的 5 个实践

1
从子智能体开始

把任务拆成 2–3 个范围精确的子项。零搭建。这是内部验证理论最便宜的方式。

2
用 worktree 隔离

每个智能体独占一个 git worktree。零合并冲突——按 feature 的 diff 也极易审核。

3
写代码前先批准计划

Teammate 写计划;lead 批准或拒绝。在计划阶段修架构的成本只有代码阶段的 1/10。

4
在 hook 里跑 lint + test

TaskCompleted 自动校验。失败则智能体继续工作。Lead 只看到全绿代码——相当于内置 CI。

5
通过 AGENTS.md 累积学习

每次会话读取,lead 持续更新。模式与陷阱成为团队的长期记忆,不必每个 sprint 重新发现。

⚠️ 经典陷阱 仅仅因为做得到就同时跑 10 个智能体。WIP 限制是美德:只跑你真正能审核的数量。超过 5 个智能体通常意味着"我在制造另一位人类要去偿还的债务"。

在 Autenticare 的具体落地

这套模式只有在生产基础设施到位时才闭环。这正是 Gemini Enterprise Agent Platform(4 月 22 日发布——完整分析)所交付的:

  • Agent Runtime 提供云端异步模式所需的”托管 VM”——亚秒级冷启动、可持续数天的会话。
  • Memory Bank + Memory ProfilesAGENTS.md 提升为平台原语——跨会话的长期记忆。
  • Agent Sandbox 是生产环境中的隔离 worktree——生成的代码在不影响真实系统的前提下运行。

并非巧合。整个行业的方向是一致的:从单次 prompt 执行迈向智能体工厂

您不再是在写软件,而是在构建写软件的工厂

生产级智能体工程

想从单智能体升级为一支管弦乐队?

我们在 Gemini Enterprise Agent Platform 上构建 3 至 5 人的智能体团队——配套 worktree、人工策划的 AGENTS.md、质量 hook 与计划审批。可审计、可复用、可度量。


灵感来自 Addy Osmani(Google Chrome)的 "The Code Agent Orchestra"。结合 Autenticare 在 Gemini Enterprise Agent Platform 上的实战栈进行改编。

延伸阅读