SOP: Optimización de Tokens en Hermes Agent

Procedimiento operativo estándar para reducir el costo de Hermes Agent en un 70%. Siete pasos, de auditoría a mantenimiento continuo.

2026-06-02

Paso 1: Auditar el consumo actual

Antes de optimizar, medir dónde se están yendo los tokens.

`bash hermes logs --level INFO | grep "tokens" > /tmp/token-audit.txt

hermes cron list `

Anotar baseline: costo mensual actual estimado.

Paso 2: Restringir toolsets en cron jobs

Regla: Cada cron job solo carga las herramientas que realmente usa.

Tipo de cron jobToolsetsAhorro estimado
Lectura de archivos["file"]-50%
Búsqueda web["web"]-45%
Solo comandos["terminal"]-40%
Guardar datos (Sheets)["terminal", "file"]-40%

Acción: Revisar cada cron job con hermes cron list y actualizar con hermes cron update --job-id --enabled-toolsets "file".

Paso 3: Convertir crons de recolección a modo script

Para crons que solo ejecutan un script y entregan output (sin análisis del LLM):

`bash hermes cron update --job-id --script "scripts/watchdog.sh"

hermes cron update --job-id --script "scripts/watchdog.sh" --no_agent true `

Candidatos típicos: - Monitoreo de estado (disk, memory, GPU) - Watchdogs de threshold - Heartbeats - Pollers de API con formato fijo

Paso 4: Activar perfil "min" para tareas livianas

Para crons que no requieren razonamiento profundo:

`bash model: provider: deepseek model: deepseek-chat/min `

Casos de uso: - Resúmenes de RSS - Scrapers que siguen plantillas - Data collection - Clasificación binaria (spam/no-spam, relevante/no-relevante)

Paso 5: Usar delegación paralela

Cuando un flujo requiere múltiples análisis independientes:

`python delegate_task(tasks=[ {"goal": "Analizar archivo A", "toolsets": ["file"]}, {"goal": "Buscar en web X", "toolsets": ["web"]}, {"goal": "Procesar datos Y", "toolsets": ["terminal"]} ]) `

Los 3 corren en paralelo, comparten contexto del orquestador, y el tiempo total es el del más lento.

Paso 6: Mantener brain.md y skills compactos

Reglas de mantenimiento: - brain.md: máximo 200 líneas. Revisar mensualmente y eliminar lo obsoleto. - Skills: máximo 100 líneas de instrucciones. Mover referencias largas a references/. - Usar skill_view(name, file_path) para cargar referencias solo cuando se necesitan.

Paso 7: Higiene de sesiones

Práctica diaria: - Usar /new cuando el tema de conversación cambia. - Si una sesión pasa de 50 mensajes, cortar y empezar nueva. - Las sesiones viejas se pueden buscar con session_search() si se necesita contexto.

Verificación

Después de aplicar todas las optimizaciones:

`bash hermes logs --level INFO --since "7 days ago" | grep "tokens"

`

Target: reducción del 60-70% en consumo mensual de tokens. Si no se alcanza, revisar el Paso 2 (toolsets) — suele ser la fuente principal de desperdicio.

Mantenimiento continuo

  • Revisar toolsets de crons cada 2 semanas.
  • Auditar brain.md mensualmente.
  • Cada nuevo cron job nace con toolsets restringidos por default.
— Ariel Di Stefano