Agentes Autónomos: Software que Decide Solo
El RPA es cosa del pasado. Conozca la nueva generación de Agentes que planifican, razonan y corrigen sus propios errores.
Fabiano Brito
CEO & Founder
Son las 03:00 de la madrugada. El servidor de pagos de Black Friday cae. La alerta llega a Slack. Su ingeniero está durmiendo. Usted está durmiendo.
Un bot tradicional enviaría un correo de "Error Fatal" y el sitio quedaría fuera hasta las 08:00. Pérdida estimada: R$ 450.000.
El Agent Engine no envía correo. Arregla el problema.
RPA vs Agente: la diferencia arquitectural
🤖 Script lineal "si-entonces"
- Primer error fuera del guión → se detiene.
- Notifica al humano y espera.
- Regla nueva = código nuevo + despliegue.
- Escala en número de scripts, no en inteligencia.
🧠 ReAct loop (Reason + Act)
- Planifica, ejecuta, observa, replanifica.
- Fallo → reflexiona sobre la causa → intenta otra cosa.
- Contexto y herramientas: el código queda estable.
- Escala en cobertura de escenarios, no en líneas.
Reasoning Loop en la práctica
Vea el log real de un incidente gestionado por un agente con ReAct:
[03:01:20] ACTION: kubectl rollout restart deployment/payment [03:01:45] OBSERVATION: Pod still failing. [03:01:47] THOUGHT: El reinicio no funcionó. Revisando logs… [03:01:50] OBSERVATION: “Java Heap Space Error” [03:01:52] ACTION: Update deployment resources limit to 4Gi [03:02:10] OBSERVATION: Health Check OK (Status 200) [03:02:12] FINAL: Incidente resuelto. Notificar Slack.
El agente diagnosticó, planificó, ejecutó, falló, replanificó y corrigió. En 2 minutos, sin despertar a nadie. Con RPA tradicional, ese mismo problema genera un ticket P1 y espera.
kubectl también puede derribar el clúster. Obligatorio: (1) lista de acciones permitidas por nivel de severidad, (2) límite de intentos antes de escalar al humano, (3) kill switch accesible, (4) audit log de cada decisión. La autonomía es un contrato, no un vale-todo.
El nuevo rol del humano
¿Significa esto el fin de los ingenieros de SRE? No. Significa que dejan de despertarse de madrugada para reiniciar servidores y empiezan a diseñar arquitecturas que se curan solas — definiendo las políticas, guardrails y runbooks que el agente ejecuta.
El robot aprieta el tornillo. Usted decide qué tornillos existen, dónde van y cuál es el torque seguro.
¿Qué incidente recurrente de su guardia vale un agente?
Diagnóstico de 30 minutos: 1 runbook candidato, estimación de tiempo y costo del piloto, análisis de riesgos y guardrails. Salimos con plan concreto o recomendación honesta de "aún no vale la pena".
