Autenticare
智能体工程 · · 9 min

GeminiClaw:本地优先的多智能体编排器

告别聊天助手。GeminiClaw是一个具有自主执行、护栏和真正治理功能的多智能体AI平台。

Fabiano Brito

Fabiano Brito

CEO & Founder

GeminiClaw:本地优先的多智能体编排器
TL;DR 市场上大多数"智能体"不过是美化了的聊天机器人。GeminiClaw恰恰相反:这是一个本地优先的多智能体运行时,具备规划门控、风险门控、循环守卫、检查点/重放和审计追踪。它是A-MAD方法论的实际实现——目前运行着Google Ads B2B、潜在客户管道和AI辅助开发编排。官方网站:geminiclaw.dev

您所见到的大多数"AI智能体"在实践中不过是美化了的聊天机器人:接收消息、调用LLM、返回文本。GeminiClaw的设计目的恰恰相反——执行真实操作,具备可追溯性、安全性和可配置的自主权


为什么要再构建一个智能体框架?

这个问题是合理的。已经有数十个框架——LangChain、LlamaIndex、CrewAI、AutoGen。简短的答案:没有一个足够好,可以在无需持续监督的情况下在生产环境中运行

我们在实际项目中发现的反复出现的问题:

通用框架

生产环境中的故障点

  • 无循环守卫——无限循环
  • 通过继承产生的过度权限
  • 会话间无边界的内存
  • 事后审计面为零
GeminiClaw

设计要素

  • 循环守卫 + 可配置自主权
  • 每个智能体的意图感知工具子集
  • agentId+chatId 隔离的内存
  • 工具调用的统一时间线

GeminiClaw基于Building Applications with AI Agents(Michael Albada,O'Reilly)构建——这是关于智能体工程最扎实的技术来源之一——然后根据我们在实地遇到的运营需求进行了调整。


对运营而言重要的架构术语

概念模型中有一个在其他框架中鲜有出现的区分:

概念 在GeminiClaw中的含义
Platform(平台)完整产品:Studio、运行时、频道、治理。
Runtime(运行时)执行层——循环、审批、重放和工具路由。
Agent(智能体)具有隔离内存和工具的认知/运营实体。
Skill(技能)一流能力包:元数据、依赖项、策略。
Tool(工具)具有明确契约的可执行能力——真实执行的原语。
Channel(频道)交付面:Telegram、CLI、WhatsApp。
Control Plane(控制平面)管理和可观测性面。

这种分离不是学术性的——它决定了如何在不产生意外耦合的情况下扩展系统。频道不是智能体。技能不是工具。MCP不是智能体。这些混淆会产生脆弱的系统。


GeminiClaw在实践中的差异化

1. 具有清晰所有权的多智能体编排

一个主编排器 + 专业下属智能体。请求所有权规则在运行时中是明确的:每个任务都保留在用户将其分配给的智能体处。交接适用于有范围的委托——而非无声的重新分配。避免"现在谁在回复?"的混淆。

每个智能体具有:意图感知工具子集(quick_answerread_onlyexecuteplan_first)、按agentId + chatId隔离,以及通过gemini-embedding-2-preview实现的长期语义记忆——这个多模态模型在向量空间中统一了文本、图像、音频和文档。

2. 具有安全门控的自主执行

这是大多数框架停下来的地方。GeminiClaw具有多层自主权控制:

1
规划门控(Planning Gate)present_code_plan)——没有经过批准的计划,任何代码变更都不会发生。
2
风险门控(Risk Gate)——高影响工具在执行前需要明确批准。
3
循环守卫(Loop Guard)——长时间操作具有可调整的自主权计数。终结无限循环。
4
检查点/重放(Checkpoint/Replay)——持久恢复。如果出现故障,从最后一个检查点恢复。
智能体之所以自主,不是因为它没有限制。而是因为限制被清晰定义——它在这些限制内自信地运行。

3. 真实的Google Ads B2B操作

最具体的垂直领域之一:通过API实现完整的Google Ads自动化。这不是"生成广告文案"——而是真实操作:

  • 通过Google Ads API进行广告系列诊断和变更
  • 批量优化工作流(optimize_campaign_batch
  • 分时段投放、预算、RSA优化、否定词、地理定向
  • 人口统计护栏自动化(apply_demographic_guard
  • 线下转化 + 线索质量管道

4. GeminiClaw Studio——缺失的控制台

整个运行时通过GeminiClaw Studio操作,这是一个面向运营人员(而非开发者)的Web控制台。

GeminiClaw Studio — Pixel Arena实时显示智能体

Pixel Arena:每个智能体以角色形式出现在地图上,实时显示状态和上下文。"STABLE"状态 + 侧面板中的引导路径。

主要界面:

  • 看板(Board)——用于任务和实时监控的运营看板。
  • 统一时间线——任务审计、工具调用历史、消息追踪。
  • 内存治理——检查、过期、编辑和清除内存,附带审计追踪。
  • 会话上下文——创建和激活在工作模式下改变内存边界的上下文。
  • 调度中心——监控预定例程。
  • 治理收件箱——按紧迫程度分组的建议,附带直接操作。
GeminiClaw Studio — 主智能体任务看板

GeminiClaw Master看板:42个任务分布在新建、进行中、待审批、已阻塞和已完成之间——附带时间戳和完整的可追溯性。

5. 通过Telegram进行上下文控制

用于现场操作的原生Telegram命令——无需打开Studio:

  • /session——显示当前活动的工作上下文
  • /session_set <sessionId>——激活特定会话
  • /session_complete——将会话标记为已完成并生成持久摘要
  • /session_suggest <消息>——建议哪个会话最符合当前意图

真实风险以及GeminiClaw仍有摩擦的地方

⚠️ 系统仍需成熟度的地方 配置曲线——Node 20+、Telegram机器人令牌、Gemini API密钥;非即插即用。自主循环中的令牌成本——循环守卫有所帮助,但需要监控。A2A互操作性仍是未来工作——MCP作为集成层得到支持,内部消息传递自有方案。许可证目前为专有/内部;公开访问在路线图中。没有绝对值:每个生产智能体系统都有局限性。

与Autenticare A-MAD方法论的联系

GeminiClaw不是附带项目——它是A-MAD方法论的实际实现(AI-Managed Agile Development,AI管理的敏捷开发),Autenticare在客户项目中使用该方法论。当我们谈论"智能体编排繁重结构,而工程师专注于20%竞争差异化因素"时,GeminiClaw就是使之成为可能的运行时。

在实际项目中:

  • 为具有重要预算的B2B客户自动化Google Ads操作
  • 在长时间辅助开发会话中管理工作上下文
  • 具有自动化质量反馈的线索到转化管道
GeminiClaw · 生产环境中的智能体

想在智能体运行时中看到治理 + 真实执行?

官方网站:geminiclaw.dev。简单前提条件:Node 20+、Telegram令牌、Gemini密钥。初始化:npm run watchdog。Autenticare以这种运营成熟度水平实施企业智能体技术栈。


延伸阅读