GeminiClaw: Orquestador Multi-Agente Local-First
Basta de asistentes de chat. GeminiClaw es una plataforma de IA multi-agente con ejecución autónoma, guardrails y gobernanza real.
Fabiano Brito
CEO & Founder
La mayoría de los "agentes de IA" que se ven por ahí son, en la práctica, chatbots glorificados: reciben un mensaje, llaman a un LLM, devuelven texto. GeminiClaw fue construido para hacer lo contrario — ejecutar operaciones reales, con trazabilidad, seguridad y autonomía configurable.
¿Por qué construir otro framework de agentes?
La pregunta es legítima. Existen decenas de frameworks — LangChain, LlamaIndex, CrewAI, AutoGen. La respuesta corta: ninguno era lo suficientemente bueno para operar en producción sin supervisión constante.
Los problemas recurrentes que identificamos en proyectos reales:
Lo que falla en producción
- Sin Loop Guard — bucles infinitos
- Permisos en exceso por herencia
- Memoria sin fronteras entre sesiones
- Cero superficie de auditoría post-incidente
Lo que fue diseñado
- Loop Guard + autonomía configurable
- Subconjuntos de herramientas por intención por agente
- Memoria aislada por
agentId+chatId - Timeline unificada de tool calls
GeminiClaw fue construido sobre Building Applications with AI Agents (Michael Albada, O'Reilly) — una de las fuentes técnicas más sólidas sobre ingeniería de agentes — y luego adaptado a las necesidades operacionales encontradas en campo.
La arquitectura en términos que importan para operaciones
El modelo conceptual tiene una distinción que raramente aparece en otros frameworks:
| Concepto | Qué es en GeminiClaw |
|---|---|
| Platform | El producto completo: Studio, runtime, canales, gobernanza. |
| Runtime | Capa de ejecución — bucles, aprobaciones, replay y enrutamiento de herramientas. |
| Agent | Entidad cognitiva/operacional con memoria y herramientas aisladas. |
| Skill | Paquete de capacidades de primera clase: metadatos, dependencias, política. |
| Tool | Capacidad ejecutable con contrato explícito — el primitivo de ejecución real. |
| Channel | Superficie de entrega: Telegram, CLI, WhatsApp. |
| Control Plane | Superficie administrativa y de observabilidad. |
Esta separación no es académica — determina cómo se expande el sistema sin crear acoplamiento accidental. Canal no es agente. Skill no es herramienta. MCP no es agente. Estas confusiones generan sistemas frágiles.
Qué hace GeminiClaw de diferente en la práctica
1. Orquestación multi-agente con ownership claro
Un orquestador principal + subordinados especializados. La regla de Request Ownership es explícita en el runtime: toda tarea permanece con el agente al que el usuario la dirigió. Los handoffs funcionan para delegación con alcance — no reasignación silenciosa. Evita la confusión "¿quién está respondiendo ahora?".
Cada agente tiene: subconjuntos de herramientas por intención (quick_answer, read_only, execute, plan_first), aislamiento por agentId + chatId, y memoria semántica de largo plazo vía gemini-embedding-2-preview — modelo multimodal que unifica texto, imágenes, audio y documentos en un espacio vectorial.
2. Ejecución autónoma con puertas de seguridad
Este es el punto donde la mayoría de los frameworks se detiene. GeminiClaw tiene control de autonomía en múltiples capas:
present_code_plan) — ninguna mutación de código ocurre sin plan aprobado.El agente no es autónomo porque no tiene límites. Es autónomo porque los límites están bien definidos — y opera con confianza dentro de ellos.
3. Operaciones reales de Google Ads B2B
Uno de los verticales más concretos: automatización completa de Google Ads vía API. No es "generar texto para anuncios" — es operación real:
- Diagnóstico y mutación de campañas vía Google Ads API
- Workflows de optimización en batch (
optimize_campaign_batch) - Dayparting, budgets, optimización de RSA, negativos, geo targeting
- Automatización de guardrail demográfico (
apply_demographic_guard) - Conversiones offline + pipeline de calidad de leads
4. GeminiClaw Studio — el panel que faltaba
Todo el runtime se opera vía GeminiClaw Studio, dashboard web orientado al operador (no al desarrollador).
Pixel Arena: cada agente aparece como personaje en el mapa, con estado y contexto visibles en tiempo real. Estado "STABLE" + Guided Paths en el panel lateral.
Las superficies principales:
- Board — Kanban operacional para tareas y monitoreo en tiempo real.
- Timeline Unificada — auditoría de tarea, historial de tool calls, trazas de mensajes.
- Memory Governance — inspección, expiración, redacción y purga de memorias, con trazabilidad de auditoría.
- Session Contexts — creación y activación de contextos que cambian fronteras de memoria en modo trabajo.
- Scheduler Center — monitoreo de rutinas programadas.
- Governance Inbox — recomendaciones agrupadas por urgencia, con acciones directas.
Board del GeminiClaw Master: 42 tareas entre New, In Progress, Awaiting Approval, Blocked y Done — con timestamps y trazabilidad completa.
5. Control de contexto vía Telegram
Comandos Telegram nativos para operación en campo — sin abrir el Studio:
/session— muestra el contexto de trabajo activo/session_set <sessionId>— activa una sesión específica/session_complete— marca sesión como completada y genera recap durable/session_suggest <mensaje>— sugiere qué sesión corresponde mejor a la intención actual
Riesgos reales y dónde GeminiClaw aún tiene fricciones
Conexión con la metodología A-MAD de Autenticare
GeminiClaw no es un proyecto paralelo — es la implementación práctica de la metodología A-MAD (AI-Managed Agile Development) que Autenticare usa en proyectos de clientes. Cuando hablamos de "agentes que orquestan la estructura pesada mientras los ingenieros se enfocan en el 20% de diferencial competitivo", GeminiClaw es el runtime que lo hace posible.
En proyectos reales:
- Automatización de operaciones de Google Ads para clientes B2B con presupuestos significativos
- Gestión de contexto de trabajo en sesiones largas de desarrollo asistido
- Pipelines de lead-to-conversion con feedback de calidad automatizado
¿Quiere ver gobernanza + ejecución real en un runtime de agentes?
Sitio oficial en geminiclaw.dev. Prerequisitos simples: Node 20+, token Telegram, clave Gemini. Inicialización: npm run watchdog. Autenticare implementa stacks de agentes enterprise con este nivel de madurez operacional.
