Autenticare
Ingeniería Agéntica · · 9 min

GeminiClaw: Orquestador Multi-Agente Local-First

Basta de asistentes de chat. GeminiClaw es una plataforma de IA multi-agente con ejecución autónoma, guardrails y gobernanza real.

Fabiano Brito

Fabiano Brito

CEO & Founder

GeminiClaw: Orquestador Multi-Agente Local-First
TL;DR La mayoría de los "agentes" en el mercado son chatbots glorificados. GeminiClaw es lo contrario: un runtime multi-agente local-first con Planning Gate, Risk Gate, Loop Guard, checkpoint/replay y trazabilidad de auditoría. Es la implementación práctica de la metodología A-MAD — operando hoy Google Ads B2B, pipelines de leads y orquestación de desarrollo asistido por IA. Sitio oficial: geminiclaw.dev.

La mayoría de los "agentes de IA" que se ven por ahí son, en la práctica, chatbots glorificados: reciben un mensaje, llaman a un LLM, devuelven texto. GeminiClaw fue construido para hacer lo contrario — ejecutar operaciones reales, con trazabilidad, seguridad y autonomía configurable.


¿Por qué construir otro framework de agentes?

La pregunta es legítima. Existen decenas de frameworks — LangChain, LlamaIndex, CrewAI, AutoGen. La respuesta corta: ninguno era lo suficientemente bueno para operar en producción sin supervisión constante.

Los problemas recurrentes que identificamos en proyectos reales:

Frameworks genéricos

Lo que falla en producción

  • Sin Loop Guard — bucles infinitos
  • Permisos en exceso por herencia
  • Memoria sin fronteras entre sesiones
  • Cero superficie de auditoría post-incidente
GeminiClaw

Lo que fue diseñado

  • Loop Guard + autonomía configurable
  • Subconjuntos de herramientas por intención por agente
  • Memoria aislada por agentId+chatId
  • Timeline unificada de tool calls

GeminiClaw fue construido sobre Building Applications with AI Agents (Michael Albada, O'Reilly) — una de las fuentes técnicas más sólidas sobre ingeniería de agentes — y luego adaptado a las necesidades operacionales encontradas en campo.


La arquitectura en términos que importan para operaciones

El modelo conceptual tiene una distinción que raramente aparece en otros frameworks:

Concepto Qué es en GeminiClaw
PlatformEl producto completo: Studio, runtime, canales, gobernanza.
RuntimeCapa de ejecución — bucles, aprobaciones, replay y enrutamiento de herramientas.
AgentEntidad cognitiva/operacional con memoria y herramientas aisladas.
SkillPaquete de capacidades de primera clase: metadatos, dependencias, política.
ToolCapacidad ejecutable con contrato explícito — el primitivo de ejecución real.
ChannelSuperficie de entrega: Telegram, CLI, WhatsApp.
Control PlaneSuperficie administrativa y de observabilidad.

Esta separación no es académica — determina cómo se expande el sistema sin crear acoplamiento accidental. Canal no es agente. Skill no es herramienta. MCP no es agente. Estas confusiones generan sistemas frágiles.


Qué hace GeminiClaw de diferente en la práctica

1. Orquestación multi-agente con ownership claro

Un orquestador principal + subordinados especializados. La regla de Request Ownership es explícita en el runtime: toda tarea permanece con el agente al que el usuario la dirigió. Los handoffs funcionan para delegación con alcance — no reasignación silenciosa. Evita la confusión "¿quién está respondiendo ahora?".

Cada agente tiene: subconjuntos de herramientas por intención (quick_answer, read_only, execute, plan_first), aislamiento por agentId + chatId, y memoria semántica de largo plazo vía gemini-embedding-2-preview — modelo multimodal que unifica texto, imágenes, audio y documentos en un espacio vectorial.

2. Ejecución autónoma con puertas de seguridad

Este es el punto donde la mayoría de los frameworks se detiene. GeminiClaw tiene control de autonomía en múltiples capas:

1
Planning Gate (present_code_plan) — ninguna mutación de código ocurre sin plan aprobado.
2
Risk Gate — las herramientas de alto impacto requieren aprobación explícita antes de ejecutar.
3
Loop Guard — las operaciones largas tienen conteo de autonomía ajustable. Fin de los bucles infinitos.
4
Checkpoint/Replay — recuperación durable. Si algo falla, retoma desde el último checkpoint.
El agente no es autónomo porque no tiene límites. Es autónomo porque los límites están bien definidos — y opera con confianza dentro de ellos.

3. Operaciones reales de Google Ads B2B

Uno de los verticales más concretos: automatización completa de Google Ads vía API. No es "generar texto para anuncios" — es operación real:

  • Diagnóstico y mutación de campañas vía Google Ads API
  • Workflows de optimización en batch (optimize_campaign_batch)
  • Dayparting, budgets, optimización de RSA, negativos, geo targeting
  • Automatización de guardrail demográfico (apply_demographic_guard)
  • Conversiones offline + pipeline de calidad de leads

4. GeminiClaw Studio — el panel que faltaba

Todo el runtime se opera vía GeminiClaw Studio, dashboard web orientado al operador (no al desarrollador).

GeminiClaw Studio — Pixel Arena con agentes en tiempo real

Pixel Arena: cada agente aparece como personaje en el mapa, con estado y contexto visibles en tiempo real. Estado "STABLE" + Guided Paths en el panel lateral.

Las superficies principales:

  • Board — Kanban operacional para tareas y monitoreo en tiempo real.
  • Timeline Unificada — auditoría de tarea, historial de tool calls, trazas de mensajes.
  • Memory Governance — inspección, expiración, redacción y purga de memorias, con trazabilidad de auditoría.
  • Session Contexts — creación y activación de contextos que cambian fronteras de memoria en modo trabajo.
  • Scheduler Center — monitoreo de rutinas programadas.
  • Governance Inbox — recomendaciones agrupadas por urgencia, con acciones directas.
GeminiClaw Studio — Board Kanban con tareas del agente master

Board del GeminiClaw Master: 42 tareas entre New, In Progress, Awaiting Approval, Blocked y Done — con timestamps y trazabilidad completa.

5. Control de contexto vía Telegram

Comandos Telegram nativos para operación en campo — sin abrir el Studio:

  • /session — muestra el contexto de trabajo activo
  • /session_set <sessionId> — activa una sesión específica
  • /session_complete — marca sesión como completada y genera recap durable
  • /session_suggest <mensaje> — sugiere qué sesión corresponde mejor a la intención actual

Riesgos reales y dónde GeminiClaw aún tiene fricciones

⚠️ Dónde el sistema aún exige madurez Curva de configuración — Node 20+, token de bot Telegram, clave Gemini API; no es plug-and-play. Costo de tokens en bucles autónomos — Loop Guard ayuda, pero exige monitoreo. Interoperabilidad A2A aún es trabajo futuro — MCP soportado como capa de integración, mensajería interna propia. Licencia actualmente propietaria/interna; acceso público en el roadmap. Sin absolutismos: todo sistema de agentes en producción tiene limitaciones.

Conexión con la metodología A-MAD de Autenticare

GeminiClaw no es un proyecto paralelo — es la implementación práctica de la metodología A-MAD (AI-Managed Agile Development) que Autenticare usa en proyectos de clientes. Cuando hablamos de "agentes que orquestan la estructura pesada mientras los ingenieros se enfocan en el 20% de diferencial competitivo", GeminiClaw es el runtime que lo hace posible.

En proyectos reales:

  • Automatización de operaciones de Google Ads para clientes B2B con presupuestos significativos
  • Gestión de contexto de trabajo en sesiones largas de desarrollo asistido
  • Pipelines de lead-to-conversion con feedback de calidad automatizado
GeminiClaw · Agentes en producción

¿Quiere ver gobernanza + ejecución real en un runtime de agentes?

Sitio oficial en geminiclaw.dev. Prerequisitos simples: Node 20+, token Telegram, clave Gemini. Inicialización: npm run watchdog. Autenticare implementa stacks de agentes enterprise con este nivel de madurez operacional.


Lea también