GeminiClaw: Orquestrador Multi-Agente Local-First

TL;DR A maioria dos "agentes" no mercado é chatbot glorificado. GeminiClaw é o oposto: runtime multi-agente local-first com Planning Gate, Risk Gate, Loop Guard, checkpoint/replay e trilha de auditoria. É a implementação prática da metodologia A-MAD — operando hoje Google Ads B2B, pipelines de leads e orquestração de desenvolvimento assistido por IA. Site oficial: geminiclaw.dev.

A maioria dos "agentes de IA" que você vê por aí são, na prática, chatbots glorificados: recebem uma mensagem, chamam uma LLM, devolvem texto. O GeminiClaw foi construído para fazer o oposto — executar operações reais, com rastreabilidade, segurança e autonomia configurável.

Por que construir mais um framework de agentes?

A pergunta é legítima. Existem dezenas de frameworks — LangChain, LlamaIndex, CrewAI, AutoGen. A resposta curta: nenhum era bom o suficiente para operar em produção sem supervisão constante.

Os problemas recorrentes que identificamos em projetos reais:

Frameworks genéricos

O que quebra em produção

Ausência de Loop Guard — loops infinitos
Permissões em excesso por herança
Memória sem fronteiras entre sessões
Zero superfície de auditoria pós-incidente

GeminiClaw

O que foi desenhado

Loop Guard + autonomia configurável
Intent-aware tool subsets por agente
Memória isolada por agentId+chatId
Timeline unificada de tool calls

O GeminiClaw foi construído sobre Building Applications with AI Agents (Michael Albada, O'Reilly) — uma das fontes técnicas mais sólidas sobre engenharia de agentes — e depois adaptado às necessidades operacionais que encontramos em campo.

A arquitetura em termos que importam para operações

O modelo conceitual tem uma distinção que raramente aparece em outros frameworks:

Conceito	O que é no GeminiClaw
Platform	O produto completo: Studio, runtime, canais, governança.
Runtime	Camada de execução — loops, aprovações, replay e roteamento de ferramentas.
Agent	Entidade cognitiva/operacional com memória e ferramentas isoladas.
Skill	Pacote de capacidades de primeira classe: metadados, dependências, política.
Tool	Capacidade executável com contrato explícito — o primitivo de execução real.
Channel	Superfície de entrega: Telegram, CLI, WhatsApp.
Control Plane	Superfície administrativa e de observabilidade.

Essa separação não é acadêmica — ela determina como você expande o sistema sem criar acoplamento acidental. Canal não é agente. Skill não é ferramenta. MCP não é agente. Essas confusões geram sistemas frágeis.

O que o GeminiClaw faz de diferente na prática

1. Orquestração multi-agente com ownership claro

Um orquestrador principal + subordinados especializados. A regra de Request Ownership é explícita no runtime: toda tarefa permanece com o agente para quem o usuário a endereçou. Handoffs funcionam para delegação com escopo — não reassignação silenciosa. Evita a confusão "quem está respondendo agora?".

Cada agente tem: intent-aware tool subsets (quick_answer, read_only, execute, plan_first), isolamento por agentId + chatId, e memória semântica de longo prazo via gemini-embedding-2-preview — modelo multimodal unificando texto, imagens, áudio e documentos num espaço vetorial.

2. Execução autônoma com portas de segurança

Este é o ponto onde a maioria dos frameworks para. O GeminiClaw tem controle de autonomia em múltiplas camadas:

Planning Gate (present_code_plan) — nenhuma mutação de código ocorre sem plano aprovado.

Risk Gate — ferramentas de alto impacto exigem aprovação explícita antes de executar.

Loop Guard — operações longas têm contagem de autonomia ajustável. Fim dos loops infinitos.

Checkpoint/Replay — recovery durável. Se algo falha, retoma do último checkpoint.

O agente não é autônomo porque não tem limites. É autônomo porque os limites estão bem definidos — e ele opera com confiança dentro deles.

3. Operações reais de Google Ads B2B

Um dos verticais mais concretos: automação completa de Google Ads via API. Não é "gerar texto para anúncios" — é operação real:

Diagnóstico e mutação de campanhas via Google Ads API
Workflows de otimização em batch (optimize_campaign_batch)
Dayparting, budgets, otimização de RSA, negativos, geo targeting
Automação de guardrail demográfico (apply_demographic_guard)
Conversões offline + pipeline de qualidade de leads

4. GeminiClaw Studio — o painel que faltava

Todo o runtime é operado via GeminiClaw Studio, dashboard web orientado ao operador (não ao desenvolvedor).

GeminiClaw Studio — Pixel Arena com agentes em tempo real

Pixel Arena: cada agente aparece como personagem no mapa, com estado e contexto visíveis em tempo real. Estado "STABLE" + Guided Paths no painel lateral.

As superfícies principais:

Board — Kanban operacional para tarefas e monitoramento em tempo real.
Timeline Unificada — auditoria de tarefa, histórico de tool calls, traces de mensagens.
Memory Governance — inspeção, expiração, redação e purge de memórias, com trilha de auditoria.
Session Contexts — criação e ativação de contextos que mudam fronteiras de memória em modo trabalho.
Scheduler Center — monitoramento de rotinas agendadas.
Governance Inbox — recomendações agrupadas por urgência, com ações diretas.

GeminiClaw Studio — Board Kanban com tarefas do agente master

Board do GeminiClaw Master: 42 tarefas entre New, In Progress, Awaiting Approval, Blocked e Done — com timestamps e rastreabilidade completa.

5. Controle de contexto via Telegram

Comandos Telegram nativos para operação em campo — sem abrir o Studio:

/session — exibe o contexto de trabalho ativo
/session_set <sessionId> — ativa uma sessão específica
/session_complete — marca sessão como concluída e gera recap durável
/session_suggest <mensagem> — sugere qual sessão melhor corresponde à intenção atual

Riscos reais e onde o GeminiClaw ainda tem fricções

⚠️ Onde o sistema ainda exige maturidade Curva de configuração — Node 20+, Telegram bot token, Gemini API key; não é plug-and-play. Custo de tokens em loops autônomos — Loop Guard ajuda, mas exige monitoramento. A2A interoperability ainda é trabalho futuro — MCP suportado como camada de integração, messaging interno próprio. Licença atualmente proprietary/internal; acesso público no roadmap. Sem absolutismos: todo sistema de agentes em produção tem limitações.

Conexão com a metodologia A-MAD da Autenticare

O GeminiClaw não é projeto paralelo — é a implementação prática da metodologia A-MAD (AI-Managed Agile Development) que a Autenticare usa em projetos de clientes. Quando falamos em "agentes que orquestram a estrutura pesada enquanto engenheiros focam nos 20% de diferencial competitivo", o GeminiClaw é o runtime que viabiliza.

Em projetos reais:

Automação de operações de Google Ads para clientes B2B com orçamentos significativos
Gestão de contexto de trabalho em sessões longas de desenvolvimento assistido
Pipelines de lead-to-conversion com feedback de qualidade automatizado

GeminiClaw · Agentes em produção

Quer ver governança + execução real num runtime de agentes?

Site oficial em geminiclaw.dev. Pré-requisitos simples: Node 20+, token Telegram, chave Gemini. Inicialização: npm run watchdog. A Autenticare implementa stacks de agentes enterprise com esse nível de maturidade operacional.

Ver geminiclaw.dev → Falar com a Autenticare