Autenticare
Engenharia Agêntica · · 9 min

GeminiClaw: Orquestrador Multi-Agente Local-First

Chega de assistentes de chat. GeminiClaw é uma plataforma de IA multi-agente com execução autônoma, guardrails e governança real.

Fabiano Brito

Fabiano Brito

CEO & Founder

GeminiClaw: Orquestrador Multi-Agente Local-First
TL;DR A maioria dos "agentes" no mercado é chatbot glorificado. GeminiClaw é o oposto: runtime multi-agente local-first com Planning Gate, Risk Gate, Loop Guard, checkpoint/replay e trilha de auditoria. É a implementação prática da metodologia A-MAD — operando hoje Google Ads B2B, pipelines de leads e orquestração de desenvolvimento assistido por IA. Site oficial: geminiclaw.dev.

A maioria dos "agentes de IA" que você vê por aí são, na prática, chatbots glorificados: recebem uma mensagem, chamam uma LLM, devolvem texto. O GeminiClaw foi construído para fazer o oposto — executar operações reais, com rastreabilidade, segurança e autonomia configurável.


Por que construir mais um framework de agentes?

A pergunta é legítima. Existem dezenas de frameworks — LangChain, LlamaIndex, CrewAI, AutoGen. A resposta curta: nenhum era bom o suficiente para operar em produção sem supervisão constante.

Os problemas recorrentes que identificamos em projetos reais:

Frameworks genéricos

O que quebra em produção

  • Ausência de Loop Guard — loops infinitos
  • Permissões em excesso por herança
  • Memória sem fronteiras entre sessões
  • Zero superfície de auditoria pós-incidente
GeminiClaw

O que foi desenhado

  • Loop Guard + autonomia configurável
  • Intent-aware tool subsets por agente
  • Memória isolada por agentId+chatId
  • Timeline unificada de tool calls

O GeminiClaw foi construído sobre Building Applications with AI Agents (Michael Albada, O'Reilly) — uma das fontes técnicas mais sólidas sobre engenharia de agentes — e depois adaptado às necessidades operacionais que encontramos em campo.


A arquitetura em termos que importam para operações

O modelo conceitual tem uma distinção que raramente aparece em outros frameworks:

Conceito O que é no GeminiClaw
PlatformO produto completo: Studio, runtime, canais, governança.
RuntimeCamada de execução — loops, aprovações, replay e roteamento de ferramentas.
AgentEntidade cognitiva/operacional com memória e ferramentas isoladas.
SkillPacote de capacidades de primeira classe: metadados, dependências, política.
ToolCapacidade executável com contrato explícito — o primitivo de execução real.
ChannelSuperfície de entrega: Telegram, CLI, WhatsApp.
Control PlaneSuperfície administrativa e de observabilidade.

Essa separação não é acadêmica — ela determina como você expande o sistema sem criar acoplamento acidental. Canal não é agente. Skill não é ferramenta. MCP não é agente. Essas confusões geram sistemas frágeis.


O que o GeminiClaw faz de diferente na prática

1. Orquestração multi-agente com ownership claro

Um orquestrador principal + subordinados especializados. A regra de Request Ownership é explícita no runtime: toda tarefa permanece com o agente para quem o usuário a endereçou. Handoffs funcionam para delegação com escopo — não reassignação silenciosa. Evita a confusão "quem está respondendo agora?".

Cada agente tem: intent-aware tool subsets (quick_answer, read_only, execute, plan_first), isolamento por agentId + chatId, e memória semântica de longo prazo via gemini-embedding-2-preview — modelo multimodal unificando texto, imagens, áudio e documentos num espaço vetorial.

2. Execução autônoma com portas de segurança

Este é o ponto onde a maioria dos frameworks para. O GeminiClaw tem controle de autonomia em múltiplas camadas:

1
Planning Gate (present_code_plan) — nenhuma mutação de código ocorre sem plano aprovado.
2
Risk Gate — ferramentas de alto impacto exigem aprovação explícita antes de executar.
3
Loop Guard — operações longas têm contagem de autonomia ajustável. Fim dos loops infinitos.
4
Checkpoint/Replay — recovery durável. Se algo falha, retoma do último checkpoint.
O agente não é autônomo porque não tem limites. É autônomo porque os limites estão bem definidos — e ele opera com confiança dentro deles.

3. Operações reais de Google Ads B2B

Um dos verticais mais concretos: automação completa de Google Ads via API. Não é "gerar texto para anúncios" — é operação real:

  • Diagnóstico e mutação de campanhas via Google Ads API
  • Workflows de otimização em batch (optimize_campaign_batch)
  • Dayparting, budgets, otimização de RSA, negativos, geo targeting
  • Automação de guardrail demográfico (apply_demographic_guard)
  • Conversões offline + pipeline de qualidade de leads

4. GeminiClaw Studio — o painel que faltava

Todo o runtime é operado via GeminiClaw Studio, dashboard web orientado ao operador (não ao desenvolvedor).

GeminiClaw Studio — Pixel Arena com agentes em tempo real

Pixel Arena: cada agente aparece como personagem no mapa, com estado e contexto visíveis em tempo real. Estado "STABLE" + Guided Paths no painel lateral.

As superfícies principais:

  • Board — Kanban operacional para tarefas e monitoramento em tempo real.
  • Timeline Unificada — auditoria de tarefa, histórico de tool calls, traces de mensagens.
  • Memory Governance — inspeção, expiração, redação e purge de memórias, com trilha de auditoria.
  • Session Contexts — criação e ativação de contextos que mudam fronteiras de memória em modo trabalho.
  • Scheduler Center — monitoramento de rotinas agendadas.
  • Governance Inbox — recomendações agrupadas por urgência, com ações diretas.
GeminiClaw Studio — Board Kanban com tarefas do agente master

Board do GeminiClaw Master: 42 tarefas entre New, In Progress, Awaiting Approval, Blocked e Done — com timestamps e rastreabilidade completa.

5. Controle de contexto via Telegram

Comandos Telegram nativos para operação em campo — sem abrir o Studio:

  • /session — exibe o contexto de trabalho ativo
  • /session_set <sessionId> — ativa uma sessão específica
  • /session_complete — marca sessão como concluída e gera recap durável
  • /session_suggest <mensagem> — sugere qual sessão melhor corresponde à intenção atual

Riscos reais e onde o GeminiClaw ainda tem fricções

⚠️ Onde o sistema ainda exige maturidade Curva de configuração — Node 20+, Telegram bot token, Gemini API key; não é plug-and-play. Custo de tokens em loops autônomos — Loop Guard ajuda, mas exige monitoramento. A2A interoperability ainda é trabalho futuro — MCP suportado como camada de integração, messaging interno próprio. Licença atualmente proprietary/internal; acesso público no roadmap. Sem absolutismos: todo sistema de agentes em produção tem limitações.

Conexão com a metodologia A-MAD da Autenticare

O GeminiClaw não é projeto paralelo — é a implementação prática da metodologia A-MAD (AI-Managed Agile Development) que a Autenticare usa em projetos de clientes. Quando falamos em "agentes que orquestram a estrutura pesada enquanto engenheiros focam nos 20% de diferencial competitivo", o GeminiClaw é o runtime que viabiliza.

Em projetos reais:

  • Automação de operações de Google Ads para clientes B2B com orçamentos significativos
  • Gestão de contexto de trabalho em sessões longas de desenvolvimento assistido
  • Pipelines de lead-to-conversion com feedback de qualidade automatizado
GeminiClaw · Agentes em produção

Quer ver governança + execução real num runtime de agentes?

Site oficial em geminiclaw.dev. Pré-requisitos simples: Node 20+, token Telegram, chave Gemini. Inicialização: npm run watchdog. A Autenticare implementa stacks de agentes enterprise com esse nível de maturidade operacional.


Leia também