Antes de optimizar, medir dónde se están yendo los tokens.
`bash
hermes logs --level INFO | grep "tokens" > /tmp/token-audit.txt
hermes cron list
`
Anotar baseline: costo mensual actual estimado.
ARTICULO
Procedimiento operativo estándar para reducir el costo de Hermes Agent en un 70%. Siete pasos, de auditoría a mantenimiento continuo.
Antes de optimizar, medir dónde se están yendo los tokens.
`bash
hermes logs --level INFO | grep "tokens" > /tmp/token-audit.txt
hermes cron list
`
Anotar baseline: costo mensual actual estimado.
Regla: Cada cron job solo carga las herramientas que realmente usa.
| Tipo de cron job | Toolsets | Ahorro estimado |
|---|---|---|
| Lectura de archivos | ["file"] | -50% |
| Búsqueda web | ["web"] | -45% |
| Solo comandos | ["terminal"] | -40% |
| Guardar datos (Sheets) | ["terminal", "file"] | -40% |
Acción: Revisar cada cron job con hermes cron list y actualizar con hermes cron update --job-id .
Para crons que solo ejecutan un script y entregan output (sin análisis del LLM):
`bash
hermes cron update --job-id
hermes cron update --job-id `
Candidatos típicos: - Monitoreo de estado (disk, memory, GPU) - Watchdogs de threshold - Heartbeats - Pollers de API con formato fijo
Para crons que no requieren razonamiento profundo:
`bash
model:
provider: deepseek
model: deepseek-chat/min
`
Casos de uso: - Resúmenes de RSS - Scrapers que siguen plantillas - Data collection - Clasificación binaria (spam/no-spam, relevante/no-relevante)
Cuando un flujo requiere múltiples análisis independientes:
`python
delegate_task(tasks=[
{"goal": "Analizar archivo A", "toolsets": ["file"]},
{"goal": "Buscar en web X", "toolsets": ["web"]},
{"goal": "Procesar datos Y", "toolsets": ["terminal"]}
])
`
Los 3 corren en paralelo, comparten contexto del orquestador, y el tiempo total es el del más lento.
Reglas de mantenimiento:
- brain.md: máximo 200 líneas. Revisar mensualmente y eliminar lo obsoleto.
- Skills: máximo 100 líneas de instrucciones. Mover referencias largas a references/.
- Usar skill_view(name, file_path) para cargar referencias solo cuando se necesitan.
Práctica diaria:
- Usar /new cuando el tema de conversación cambia.
- Si una sesión pasa de 50 mensajes, cortar y empezar nueva.
- Las sesiones viejas se pueden buscar con session_search() si se necesita contexto.
Después de aplicar todas las optimizaciones:
`bash
hermes logs --level INFO --since "7 days ago" | grep "tokens"
`
Target: reducción del 60-70% en consumo mensual de tokens. Si no se alcanza, revisar el Paso 2 (toolsets) — suele ser la fuente principal de desperdicio.