GeminiClaw: Orquestrador Multi-Agente Local-First
Chega de assistentes de chat. GeminiClaw é uma plataforma de IA multi-agente com execução autônoma, guardrails e governança real.
Fabiano Brito
CEO & Founder
A maioria dos "agentes de IA" que você vê por aí são, na prática, chatbots glorificados: recebem uma mensagem, chamam uma LLM, devolvem texto. O GeminiClaw foi construído para fazer o oposto — executar operações reais, com rastreabilidade, segurança e autonomia configurável.
Por que construir mais um framework de agentes?
A pergunta é legítima. Existem dezenas de frameworks — LangChain, LlamaIndex, CrewAI, AutoGen. A resposta curta: nenhum era bom o suficiente para operar em produção sem supervisão constante.
Os problemas recorrentes que identificamos em projetos reais:
O que quebra em produção
- Ausência de Loop Guard — loops infinitos
- Permissões em excesso por herança
- Memória sem fronteiras entre sessões
- Zero superfície de auditoria pós-incidente
O que foi desenhado
- Loop Guard + autonomia configurável
- Intent-aware tool subsets por agente
- Memória isolada por
agentId+chatId - Timeline unificada de tool calls
O GeminiClaw foi construído sobre Building Applications with AI Agents (Michael Albada, O'Reilly) — uma das fontes técnicas mais sólidas sobre engenharia de agentes — e depois adaptado às necessidades operacionais que encontramos em campo.
A arquitetura em termos que importam para operações
O modelo conceitual tem uma distinção que raramente aparece em outros frameworks:
| Conceito | O que é no GeminiClaw |
|---|---|
| Platform | O produto completo: Studio, runtime, canais, governança. |
| Runtime | Camada de execução — loops, aprovações, replay e roteamento de ferramentas. |
| Agent | Entidade cognitiva/operacional com memória e ferramentas isoladas. |
| Skill | Pacote de capacidades de primeira classe: metadados, dependências, política. |
| Tool | Capacidade executável com contrato explícito — o primitivo de execução real. |
| Channel | Superfície de entrega: Telegram, CLI, WhatsApp. |
| Control Plane | Superfície administrativa e de observabilidade. |
Essa separação não é acadêmica — ela determina como você expande o sistema sem criar acoplamento acidental. Canal não é agente. Skill não é ferramenta. MCP não é agente. Essas confusões geram sistemas frágeis.
O que o GeminiClaw faz de diferente na prática
1. Orquestração multi-agente com ownership claro
Um orquestrador principal + subordinados especializados. A regra de Request Ownership é explícita no runtime: toda tarefa permanece com o agente para quem o usuário a endereçou. Handoffs funcionam para delegação com escopo — não reassignação silenciosa. Evita a confusão "quem está respondendo agora?".
Cada agente tem: intent-aware tool subsets (quick_answer, read_only, execute, plan_first), isolamento por agentId + chatId, e memória semântica de longo prazo via gemini-embedding-2-preview — modelo multimodal unificando texto, imagens, áudio e documentos num espaço vetorial.
2. Execução autônoma com portas de segurança
Este é o ponto onde a maioria dos frameworks para. O GeminiClaw tem controle de autonomia em múltiplas camadas:
present_code_plan) — nenhuma mutação de código ocorre sem plano aprovado.O agente não é autônomo porque não tem limites. É autônomo porque os limites estão bem definidos — e ele opera com confiança dentro deles.
3. Operações reais de Google Ads B2B
Um dos verticais mais concretos: automação completa de Google Ads via API. Não é "gerar texto para anúncios" — é operação real:
- Diagnóstico e mutação de campanhas via Google Ads API
- Workflows de otimização em batch (
optimize_campaign_batch) - Dayparting, budgets, otimização de RSA, negativos, geo targeting
- Automação de guardrail demográfico (
apply_demographic_guard) - Conversões offline + pipeline de qualidade de leads
4. GeminiClaw Studio — o painel que faltava
Todo o runtime é operado via GeminiClaw Studio, dashboard web orientado ao operador (não ao desenvolvedor).
Pixel Arena: cada agente aparece como personagem no mapa, com estado e contexto visíveis em tempo real. Estado "STABLE" + Guided Paths no painel lateral.
As superfícies principais:
- Board — Kanban operacional para tarefas e monitoramento em tempo real.
- Timeline Unificada — auditoria de tarefa, histórico de tool calls, traces de mensagens.
- Memory Governance — inspeção, expiração, redação e purge de memórias, com trilha de auditoria.
- Session Contexts — criação e ativação de contextos que mudam fronteiras de memória em modo trabalho.
- Scheduler Center — monitoramento de rotinas agendadas.
- Governance Inbox — recomendações agrupadas por urgência, com ações diretas.
Board do GeminiClaw Master: 42 tarefas entre New, In Progress, Awaiting Approval, Blocked e Done — com timestamps e rastreabilidade completa.
5. Controle de contexto via Telegram
Comandos Telegram nativos para operação em campo — sem abrir o Studio:
/session— exibe o contexto de trabalho ativo/session_set <sessionId>— ativa uma sessão específica/session_complete— marca sessão como concluída e gera recap durável/session_suggest <mensagem>— sugere qual sessão melhor corresponde à intenção atual
Riscos reais e onde o GeminiClaw ainda tem fricções
Conexão com a metodologia A-MAD da Autenticare
O GeminiClaw não é projeto paralelo — é a implementação prática da metodologia A-MAD (AI-Managed Agile Development) que a Autenticare usa em projetos de clientes. Quando falamos em "agentes que orquestram a estrutura pesada enquanto engenheiros focam nos 20% de diferencial competitivo", o GeminiClaw é o runtime que viabiliza.
Em projetos reais:
- Automação de operações de Google Ads para clientes B2B com orçamentos significativos
- Gestão de contexto de trabalho em sessões longas de desenvolvimento assistido
- Pipelines de lead-to-conversion com feedback de qualidade automatizado
Quer ver governança + execução real num runtime de agentes?
Site oficial em geminiclaw.dev. Pré-requisitos simples: Node 20+, token Telegram, chave Gemini. Inicialização: npm run watchdog. A Autenticare implementa stacks de agentes enterprise com esse nível de maturidade operacional.
