Autenticare
Ingeniería Agéntica · · 7 min

La orquesta de agentes: por qué 3 especialistas vencen a 1 generalista en producción

El modelo de 'un agente hace todo' tocó techo. La próxima generación coordina equipos de agentes especializados — con contextos aislados, worktrees, lista de tareas compartida y puertas de calidad. Inspirado en Addy Osmani, adaptado al stack de Gemini Enterprise Agent Platform que operamos en Autenticare.

Fabiano Brito

Fabiano Brito

CEO & Founder

La orquesta de agentes: por qué 3 especialistas vencen a 1 generalista en producción
TL;DR Emparejar con un único agente es lo que la mayoría practica — y donde la mayoría se atasca. Los equipos productivos hoy coordinan 3 a 5 agentes especializados, cada uno con su propio contexto, en worktrees aislados, sincronizándose vía una lista de tareas compartida, con puertas de calidad automatizadas. El cuello de botella ya no es generación de código — es verificación. Y la palanca ya no es el prompt: es la especificación.

El techo del agente único

Quien lleva más de seis meses trabajando con agentes ya lo sintió: hay una meseta en la que añadir más prompts deja de acelerar. Tres restricciones explican el techo:

Restricción 1

📚 Sobrecarga de contexto

Bases reales de cliente exceden cualquier ventana. Cuando el agente intenta "recordar" todo a la vez, olvida lo esencial.

Restricción 2

🎯 Sin especialización

Un agente que hace base de datos, API, UI y tests se vuelve "todólogo" — maestro de nada. El agente que solo conoce la capa de datos escribe mejor SQL.

Restricción 3

🚦 Sin coordinación

Varios agentes sin primitivos de coordinación (locks de archivo, dependencias de tarea) se vuelven caos. Los conflictos de merge se comen las ganancias de paralelismo.

Director vs orquestador

La metáfora que mejor captura el cambio (se la debemos a Addy Osmani): pasas de director — guiando a un único músico en tiempo real — a orquestador — coordinando una orquesta entera de forma asíncrona. El hilo de chat deja de ser tu entorno; el repositorio (y el tablero de tareas) ocupa su lugar.

DimensiónDirector (1 agente)Orquestador (equipo)
ModoSíncrono — esperas cada respuestaAsíncrono — planeas y revisas
ContextoTu ventana es el techoN ventanas independientes, una por especialista
Throughput1× — secuencial~3× con 3 agentes en paralelo
WorkspaceHilo de chatRepo + worktrees + lista de tareas
Tu rolTipeador de promptsIngeniero de proceso: spec, gates, retro

Tres patrones de orquestación

En producción usamos tres patrones — elegidos por alcance de la tarea, no por moda:

Patrón 1

🌿 Subagents

El padre descompone, delega a hijos enfocados, gestiona el grafo de dependencias manualmente. Sin setup — empieza hoy. Coste neutro en tokens.

Setup
Ninguno
Sweet spot
2–4 hijos
Patrón 2

👥 Agent Teams

Team Lead + lista de tareas compartida con lock de archivo + mensajería peer-to-peer. Auto-desbloqueo cuando caen las dependencias.

Sweet spot
3–5 agentes
Coordinación
Task list + locks
Patrón 3

☁️ Cloud Async

Asignas la tarea, cierras el laptop, vuelves al PR. Corre en VMs gestionadas — en nuestro caso, sobre Agent Runtime de Gemini Enterprise Agent Platform.

Modo
Fire-and-forget
Sesión
Días continuos

El cuello de botella ya no es generación. Es verificación. La revisión humana no es overhead opcional — es el sistema de seguridad.

Los números que importan

~3×
Throughput
3 agentes en paralelo
3–5
Sweet spot del equipo
por encima, dispersión
−3%
Cuando la IA escribe el AGENTS.md
+20% de coste (ETH Zurich)

El número de la derecha es importante: una investigación de Gloaguen et al. (ETH Zurich) muestra que dejar a los agentes escribir su propio AGENTS.md degrada el desempeño en ~3% y aumenta el coste en más de 20%. El AGENTS.md debe ser curado por humano — es lo que codifica el conocimiento institucional del equipo.

AGENTS.md: el cerebro compartido

Cuatro secciones bastan:

## STYLE
- Componentes funcionales con hooks; named exports
- Errores siempre tipados; nunca `throw "string"`

## GOTCHAS
- SQLite requiere WAL para lecturas concurrentes
- El orden de los middlewares Express importa para auth

## ARCH_DECISIONS
- Estado en SQLite, sin caché en memoria
- Un Express router por feature module

## TEST_STRATEGY
- Integration > unit para rutas HTTP
- supertest para aserciones de request

Cada sesión lee. Ningún agente escribe directamente — el lead aprueba cada línea que entra.

5 prácticas para empezar mañana

1
Empieza con subagents

Descompón la tarea en 2–3 hijos con alcance quirúrgico. Sin setup. Es la forma más barata de probar la tesis internamente.

2
Aísla con worktrees

Cada agente en su propio worktree git. Cero conflictos de merge — y un diff por feature trivial de revisar.

3
Plan approval antes de codear

Teammate escribe el plan; lead aprueba o rechaza. Corregir arquitectura en fase de plan cuesta 1/10 de corregirla en código.

4
Hooks corriendo lint + test

En TaskCompleted, valida automáticamente. Si falla, el agente sigue trabajando. El lead solo ve código en verde — funciona como CI integrado.

5
Compound learning vía AGENTS.md

Cada sesión lee, el lead actualiza. Patrones y gotchas se vuelven memoria de largo plazo del equipo — no se redescubren cada sprint.

⚠️ Trampa clásica Levantar 10 agentes en paralelo solo porque se puede. El WIP limit es virtud: corre solo lo que puedas revisar de verdad. Por encima de 5 agentes normalmente significa "estoy generando deuda que otro humano va a pagar".

Qué cambia en Autenticare

Este modelo solo cierra en producción cuando hay infraestructura para sostenerlo. Es exactamente lo que el Gemini Enterprise Agent Platform (anunciado el 22/04 — análisis completo aquí) entregó:

  • Agent Runtime da las “VMs gestionadas” del patrón Cloud Async — cold start <1s, sesiones de días.
  • Memory Bank + Memory Profiles es AGENTS.md elevado a primitivo de plataforma — memoria de largo plazo entre sesiones.
  • Agent Sandbox es el worktree aislado en producción — el código generado corre sin riesgo para el sistema real.

No es coincidencia. El camino de la industria es el mismo: del prompt aislado a la fábrica de agentes.

Ya no estás escribiendo software. Estás construyendo la fábrica que escribe el software.

Ingeniería agéntica en producción

¿Quieres pasar del agente único a una orquesta?

Estructuramos equipos de 3 a 5 agentes sobre Gemini Enterprise Agent Platform — con worktrees, AGENTS.md curado, hooks de calidad y plan approval. Auditable, repetible y medible.


Inspirado en "The Code Agent Orchestra" de Addy Osmani (Google Chrome). Adaptado al stack que operamos en Autenticare sobre Gemini Enterprise Agent Platform.

Lea también