Autenticare
代理工程 · · 5分钟

AGENTS.md:为什么应该由人类而不是AI来编写代理上下文

苏黎世联邦理工学院的一项研究表明,代理编写自己的上下文文件会使性能降低3%,并将成本增加20%。查看经过测试的Autenticare模板。

Fabiano Brito

Fabiano Brito

CTO, Autenticare

AGENTS.md:为什么应该由人类而不是AI来编写代理上下文
总结 (TL;DR)AGENTS.md的创建工作委托给LLM本身看似高效,但在可预测性方面付出了高昂的代价。苏黎世联邦理工学院(Gloaguen等)的最新数据证明:由人类严格维护的上下文文件在性能和Token经济性方面均优于自动生成的上下文。

在复杂的代码库中协调自主代理需要明确的规则。当你让代理在代码中自由运行,它们需要项目的地理地图、架构边界和本地反模式。社区中最常见的解决方案是AGENTS.md文件。

但是谁应该编写这个文件呢?

许多团队通过LLM自动创建上下文(“阅读此存储库并总结规则”)。然而,研究和我们在Autenticare的实践经验表明,这是一个架构缺陷。

自动生成的代价

−3%
性能
任务解决成功率
+20%
成本
Token消耗增加
100%
人类控制
经过测试的理想模型

根据苏黎世联邦理工学院的最新研究,允许代理自行推断和记录项目规则会导致任务执行的成功率下降3%成本增加20%

原因很简单:LLM关注代码”做”什么(阅读文件已经很明显了),但缺乏”为什么”这样做的意图。生成AGENTS.md的代理创建的是空洞的技术描述,而不是业务约束(constraints)。

经过测试的Autenticare模板

1
身份和操作契约

定义预期行为、语气(例如强制使用直接回复),以及代理在存储库中可以或不可以做什么的界限。

2
严格的架构地图

与其描述src/文件夹是什么,不如确定新事物应该去哪(例如:"永远不要在ui/之外创建通用组件")。

3
本地反模式目录

最有价值的部分:列出看起来正确但在您的公司中被禁止的解决方案(例如:"永远不要使用lodash,我们有原生助手")。

⚠️ 自动化的悖论 不要试图自动化基础治理。AGENTS.md文件是您与AI的契约。如果AI编写自己的契约,它自然会将规则塑造成阻力最小的路径,而忽略长期的技术债务。
对于可扩展的代理工程,手工编写战略上下文,让LLM仅自动化战术执行。

您的AGENTS.md不是wiki;它是行为的电围栏。请这样对待它。

要使用Autenticare的最佳实践构建AI编排的基础,请探索我们的代理工厂。需要平台治理方面的帮助?请与我们的团队联系