GeminiClaw:本地优先的多智能体编排器
告别聊天助手。GeminiClaw是一个具有自主执行、护栏和真正治理功能的多智能体AI平台。
Fabiano Brito
CEO & Founder
您所见到的大多数"AI智能体"在实践中不过是美化了的聊天机器人:接收消息、调用LLM、返回文本。GeminiClaw的设计目的恰恰相反——执行真实操作,具备可追溯性、安全性和可配置的自主权。
为什么要再构建一个智能体框架?
这个问题是合理的。已经有数十个框架——LangChain、LlamaIndex、CrewAI、AutoGen。简短的答案:没有一个足够好,可以在无需持续监督的情况下在生产环境中运行。
我们在实际项目中发现的反复出现的问题:
生产环境中的故障点
- 无循环守卫——无限循环
- 通过继承产生的过度权限
- 会话间无边界的内存
- 事后审计面为零
设计要素
- 循环守卫 + 可配置自主权
- 每个智能体的意图感知工具子集
- 按
agentId+chatId隔离的内存 - 工具调用的统一时间线
GeminiClaw基于Building Applications with AI Agents(Michael Albada,O'Reilly)构建——这是关于智能体工程最扎实的技术来源之一——然后根据我们在实地遇到的运营需求进行了调整。
对运营而言重要的架构术语
概念模型中有一个在其他框架中鲜有出现的区分:
| 概念 | 在GeminiClaw中的含义 |
|---|---|
| Platform(平台) | 完整产品:Studio、运行时、频道、治理。 |
| Runtime(运行时) | 执行层——循环、审批、重放和工具路由。 |
| Agent(智能体) | 具有隔离内存和工具的认知/运营实体。 |
| Skill(技能) | 一流能力包:元数据、依赖项、策略。 |
| Tool(工具) | 具有明确契约的可执行能力——真实执行的原语。 |
| Channel(频道) | 交付面:Telegram、CLI、WhatsApp。 |
| Control Plane(控制平面) | 管理和可观测性面。 |
这种分离不是学术性的——它决定了如何在不产生意外耦合的情况下扩展系统。频道不是智能体。技能不是工具。MCP不是智能体。这些混淆会产生脆弱的系统。
GeminiClaw在实践中的差异化
1. 具有清晰所有权的多智能体编排
一个主编排器 + 专业下属智能体。请求所有权规则在运行时中是明确的:每个任务都保留在用户将其分配给的智能体处。交接适用于有范围的委托——而非无声的重新分配。避免"现在谁在回复?"的混淆。
每个智能体具有:意图感知工具子集(quick_answer、read_only、execute、plan_first)、按agentId + chatId隔离,以及通过gemini-embedding-2-preview实现的长期语义记忆——这个多模态模型在向量空间中统一了文本、图像、音频和文档。
2. 具有安全门控的自主执行
这是大多数框架停下来的地方。GeminiClaw具有多层自主权控制:
present_code_plan)——没有经过批准的计划,任何代码变更都不会发生。智能体之所以自主,不是因为它没有限制。而是因为限制被清晰定义——它在这些限制内自信地运行。
3. 真实的Google Ads B2B操作
最具体的垂直领域之一:通过API实现完整的Google Ads自动化。这不是"生成广告文案"——而是真实操作:
- 通过Google Ads API进行广告系列诊断和变更
- 批量优化工作流(
optimize_campaign_batch) - 分时段投放、预算、RSA优化、否定词、地理定向
- 人口统计护栏自动化(
apply_demographic_guard) - 线下转化 + 线索质量管道
4. GeminiClaw Studio——缺失的控制台
整个运行时通过GeminiClaw Studio操作,这是一个面向运营人员(而非开发者)的Web控制台。
Pixel Arena:每个智能体以角色形式出现在地图上,实时显示状态和上下文。"STABLE"状态 + 侧面板中的引导路径。
主要界面:
- 看板(Board)——用于任务和实时监控的运营看板。
- 统一时间线——任务审计、工具调用历史、消息追踪。
- 内存治理——检查、过期、编辑和清除内存,附带审计追踪。
- 会话上下文——创建和激活在工作模式下改变内存边界的上下文。
- 调度中心——监控预定例程。
- 治理收件箱——按紧迫程度分组的建议,附带直接操作。
GeminiClaw Master看板:42个任务分布在新建、进行中、待审批、已阻塞和已完成之间——附带时间戳和完整的可追溯性。
5. 通过Telegram进行上下文控制
用于现场操作的原生Telegram命令——无需打开Studio:
/session——显示当前活动的工作上下文/session_set <sessionId>——激活特定会话/session_complete——将会话标记为已完成并生成持久摘要/session_suggest <消息>——建议哪个会话最符合当前意图
真实风险以及GeminiClaw仍有摩擦的地方
与Autenticare A-MAD方法论的联系
GeminiClaw不是附带项目——它是A-MAD方法论的实际实现(AI-Managed Agile Development,AI管理的敏捷开发),Autenticare在客户项目中使用该方法论。当我们谈论"智能体编排繁重结构,而工程师专注于20%竞争差异化因素"时,GeminiClaw就是使之成为可能的运行时。
在实际项目中:
- 为具有重要预算的B2B客户自动化Google Ads操作
- 在长时间辅助开发会话中管理工作上下文
- 具有自动化质量反馈的线索到转化管道
想在智能体运行时中看到治理 + 真实执行?
官方网站:geminiclaw.dev。简单前提条件:Node 20+、Telegram令牌、Gemini密钥。初始化:npm run watchdog。Autenticare以这种运营成熟度水平实施企业智能体技术栈。
