WTF Is a Loop: Steinberger vs. Cherny y la infraestructura que reemplaza al prompt engineering

64 fuentes, 2.2M views, y una pregunta que nadie sabía responder. Matt Van Horn rastrea la historia completa del Loop Engineering.

2026-06-09

El tuit que tiene al timeline en un puño

Un solo tuit tuvo obsesionado a todo el timeline de AI coding esta semana. Peter Steinberger lo posteó el 7 de junio, superó los 2.2 millones de views, y las replies se convirtieron en una pelea sobre qué significaba realmente.

> "Recordatorio mensual: ya no deberías estar prompeteando agentes de código. Deberías estar diseñando loops que prompetean a tus agentes."

— @steipete, 7 de junio de 2026

Esa es la frase que todo el mundo está citando. La reply más reveladora vino de Varadh Jain, que hizo la única pregunta que importaba: ¿cómo se ve esto en la práctica? Y la respuesta que se convirtió en todo el mood fue la de Matthew Berman.

> "nadie sabe excepto él y boris."

— @MatthewBerman, 7 de junio de 2026

Esa es la historia real. No que los loops sean el futuro, sino que una frase de seis palabras llegó a dos millones de views mientras la gente que la amplificaba se peleaba en las replies sobre qué significaba. No puse los ojos en blanco, porque yo corro un loop todas las noches que abre pull requests en unos treinta repos open-source mientras duermo. Noventa segundos de investigación me devolvieron quince threads de Reddit, veintiún posts de X, y un patrón incómodo: la idea más ruidosa en AI coding es una que la mayoría de la gente que la repite no puede explicar.

Un bando gritaba que el prompt engineering está muerto. El otro bando, el que tiene las manos en el teclado, fue más cuidadoso.

> "No son ralph/goal loops, eso ya es viejo. Es probablemente algún tipo de loop de orquestación continua que supervisa otros threads/agentes."

— @trashpandaemoji, 7 de junio de 2026

Esa reply es lo más cercano a una respuesta correcta que alguien posteó. Guardátela.

Qué es realmente un loop

Boris Cherny creó Claude Code como proyecto paralelo en septiembre de 2024. Hoy representa cerca del cuatro por ciento de todos los commits públicos en GitHub. En el escenario del evento Acquired Unplugged organizado por WorkOS el 2 de junio, dio la definición más limpia de un loop que vas a encontrar.

> "Ahora subió de nivel, creo, de nuevo, a la próxima ola de abstracción donde yo ya no prompeteo a Claude. Tengo loops corriendo. Son ellos los que prompetean a Claude y deciden qué hacer. Mi trabajo es escribir loops."

— Boris Cherny, WorkOS Acquired Unplugged, 2 de junio de 2026

Así que acá está la versión simple. Un loop es un pequeño programa que escribís que prompetea al agente de código por vos, lee lo que produjo, decide si terminó, y si no, lo prompetea de nuevo. Dejás de ser la cosa adentro del loop tipeando prompts. Te convertís en el autor del loop. El modelo se vuelve una subrutina.

Boris lo cuenta como tres etapas, y ubicarte en su escalera es la forma más rápida de entenderlo. Hace un año escribía código a mano con autocomplete. Después corría cinco a diez sesiones de Claude en paralelo y prompeteaba cada una. Ahora no prompetea nada. Escribe los loops que prompetean a Claude, y un par de cientos de agentes leen su GitHub, Slack y Twitter y deciden qué construir después. Tiene el recibo.

> "En los últimos 30 días, el 100% de mis contribuciones a Claude Code fueron escritas por Claude Code. Hice landing de 259 PRs."

— Boris Cherny, vía Simon Willison, 27 de diciembre de 2025

Borró su IDE en noviembre y no lo abrió desde entonces. El matiz que la multitud del "prompt-engineering-está-muerto" se saltea: no está diciendo que los ingenieros sean obsoletos. Alguien todavía tiene que decidir qué construir, hablar con clientes y coordinar equipos — y dice que los grandes ingenieros importan más que nunca. El trabajo no desapareció. Subió una altitud: de escribir el código a escribir lo que escribe el código.

El espectro: de ReAct a la orquestación

Las replies eran un quilombo porque "loop" esconde por lo menos cinco cosas distintas. Esta es la escalera, de más vieja a más nueva, para que dejes de hablar sin entenderte.

Etapa uno es el while-loop académico. El paper ReAct de 2022 lo formalizó: el modelo razona, llama una herramienta, lee el resultado, repite hasta terminar. Un modelo, un loop, un humano mirando.

Etapa dos es AutoGPT en 2023, que le daba un objetivo y lo dejaba prompeteándose a sí mismo — y que se hizo famoso por girar para siempre sin hacer nada. Ese fracaso sembró años de "los agentes son un juguete".

Etapa tres es la que Trash Panda llamó vieja: el ralph loop, publicado por Geoffrey Huntley en julio de 2025. Es casi insultantemente simple: un one-liner de bash que pipea el mismo archivo de prompt al agente una y otra vez. Su verdadera innovación fue disciplina: cada iteración resetea el contexto a un conjunto fijo de archivos ancla en vez de dejar que la conversación crezca. Huntley construyó un lenguaje de programación entero con esto por unos 297 dólares.

Etapa cuatro lo productizó: en primavera de 2026, tanto Codex como Claude Code lanzaron un comando /goal que corre el ralph loop hasta que un pequeño modelo validador confirma que la tarea está hecha.

Etapa cinco es lo que Boris y Steinberger realmente quieren decir, y es genuinamente nuevo, no rebrandeado. Cuatro cosas cambiaron. El loop se volvió la unidad de trabajo, no la tarea. Los loops empezaron a supervisar otros loops, concurrentemente y en schedule. El scheduling reemplazó el kickoff humano — el loop corre en tiempo de infraestructura en vez de tu atención. Y la durabilidad se volvió explícita, con estado respaldado en git y recuperación de crashes, porque estas cosas tienen que sobrevivir un reinicio. Ralph asumía que tu terminal seguía abierta. La versión 2026 asume que no.

Así que Trash Panda tenía razón dos veces: el ralph loop de un solo agente es viejo. El loop de orquestación multi-agente arriba de eso es lo nuevo.

Es solo un cron job con sombrero

La mejor línea escéptica de todo el corpus fueron cuatro palabras, posteadas abajo de alguien babeando con que "loops es hacia donde vamos".

> "Los cronjobs tienen un rebranding gracioso ahora."

— reply en X, discusión sobre loops, junio 2026

Esto merece una respuesta directa, no una evasiva, porque tiene media razón. Sí, la capa de scheduling es cron. Boris literalmente corre los suyos en cron. El comando /loop de Claude Code usa cron por debajo. Si toda tu definición de loop es "algo que corre con un timer", entonces sí, inventamos eso en 1975 y te podés ir a casa.

Lo que cron nunca tuvo es la parte del medio. Un cron job corre un script fijo. Un loop corre un modelo que mira el estado actual, decide qué hacer después, lo hace, verifica si funcionó, y decide si seguir. La decisión es del agente, no tuya, y no es una rama hardcodeada. Stackeá varios, dejá que un loop despache y supervise a otros, dales estado compartido durable, y tenés algo que cron no puede expresar.

El encuadre honesto no es que los loops son magia nueva ni que los loops son solo cron. Es que los loops son cron más un tomador de decisiones en el cuerpo, y la ingeniería interesante es todo lo que envolvés alrededor de esa decisión para que no se vaya por un precipicio.

Cómo se ve cuando realmente construís uno

Basta de teoría. El on-ramp es una línea. Claude Code lanzó /loop, y el ejemplo canónico de Boris es el starter. Pegá esto y cambiá los sustantivos.

` /loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them. `

Y acá está su receta más completa. Días después, Boris posteó cinco tips para correr Opus autónomamente por horas o días:

> Cinco tips, en sus palabras: usá auto mode para permisos así Claude no pide aprobación; usá dynamic workflows para que Claude orqueste cientos o miles de agentes; usá /goal o /loop para empujar a Claude a seguir hasta terminar; corré Claude Code en la nube para poder cerrar la laptop; y asegurate de que Claude tenga forma de auto-verificar su trabajo end-to-end.

— @bcherny, junio 2026

El tip cinco es el que el hype se saltea y los practitioners obsesionan: un loop es tan confiable como su capacidad de verificar su propio trabajo.

Esa es toda la idea en miniatura. No escribiste los pasos. Escribiste la intención y el comportamiento de parada, y el loop prompetea al agente en cada tick.

El lado profundo es Gas Town de Steve Yegge, lanzado en enero: veinte a treinta instancias de Claude Code coordinadas por un agente Mayor, con agentes patrulla que corren loops continuos y estado guardado en git para que el trabajo sobreviva un crash. Eso es el loop de orquestación continua que supervisa otros threads al que Trash Panda estaba apuntando — shippeado y open source.

Pero la lección más práctica de toda la investigación es que un loop es tan bueno como su capacidad de verificarse. El subtema de más rápido crecimiento no fue orquestación — fue verificación.

> "Tu agente de código puede moverse rápido, pero los malos commits también se acumulan rápido."

— @DanKornas, junio 2026

Kornas está shippeando roborev, una herramienta que revisa cada commit en background y devuelve los hallazgos al agente mientras el contexto todavía está fresco. Un loop abierto que escribe código sin feedback es una máquina de generar errores confiados. Un loop que escribe, corre, lee el resultado y corrige es lo que realmente funciona. El loop no es la magia. El feedback adentro de él sí.

El plot twist: el loop es ahora la parte cara

Acá es donde la investigación pasó de filosofía a problema financiero. La deflación más filosa de toda la mitología de agentes vino de un ingeniero que labura.

> "Cada ai agent que shippeé este año es un for-loop, un llamado a LLM, y un try/catch alrededor del parseo de JSON. Lo único agéntico es la factura de Anthropic a fin de mes."

— @rohit_jsfreaky, junio 2026

Esa factura no es chiste. El recibo del mes: Uber capeó a sus ingenieros en 1.500 dólares por persona por herramienta por mes para Claude Code y Cursor después de quemar su presupuesto anual de AI en cuatro meses. Una vez que el modelo escribe el código por casi nada, el costo se mueve al loop que lo corre.

> "Lo más costoso en AI coding ya no es escribir código, es manejar el loop del agente."

— @runes_leo, junio 2026

Y el modo de falla que todos en producción tienen miedo es el loop que no para.

> "Sin guardrails, tenés loops infinitos y sorpresas de billing órdenes de magnitud sobre el presupuesto."

— @cv_usk, junio 2026

Por eso cada write-up serio de 2026 sobre loops converge en los mismos tres hard stops: un máximo de iteraciones, detección de no-progreso, y un techo de presupuesto en tokens o dólares. La versión romántica de los loops es que escribís los loops y mil agentes construyen tu empresa de la noche a la mañana. La versión de producción es que escribís los loops, y la mayor parte de tu laburo es asegurarte de que paren.

Gartner pone AI agéntica en el pico de expectativas infladas, con solo el diecisiete por ciento de las organizaciones realmente deployando agentes. La brecha entre el timeline y los recibos es el estado real de la cuestión.

No son los loops. Son los skills.

Esta es mi conclusión, y es donde aterrizo después de una semana mirando esto. El loop es plomería. El activo es el skill que llama.

El otro punto recurrente de Steinberger hace par con el de los loops y es la mitad más durable: si hacés algo más de una vez, convertilo en un skill automatizado, y si hacés algo difícil, convertilo en un skill después para que la próxima sea gratis. Un loop sin skills reutilizables adentro es solo un while-true alrededor de un desconocido. Un loop que llama una librería de skills afilados, testeados y con nombre es un sistema que compone.

> "Mucha gente está poniendo los ojos en blanco en Twitter, pero yo tengo las orejas paradas."

— r/ChatGPTCoding, junio 2026

Así que la respuesta a WTF es un loop no es un hot take sobre que el prompt engineering está muriendo. Es esto: dejá de ser la cosa adentro del loop. Escribí el loop una vez, dale skills que valga la pena llamar y feedback para que pueda verificarse, capealo para que pare, y dejalo correr en cron mientras vos vas a decidir qué construir después.

Steinberger y Boris están describiendo el mismo animal desde dos lados. La única gente que realmente sabe son los que ya construyeron uno. La buena noticia es que, a partir de este mes, el on-ramp es un solo slash command.

Patrones clave de la investigación

  • Un loop es cron más un tomador de decisiones en el cuerpo: el modelo, no una rama hardcodeada, elige la próxima acción en cada tick.
  • El linaje es real: ReAct en 2022, AutoGPT en 2023, ralph en 2025, /goal en primavera 2026, loops de orquestación ahora. El ralph single-agent es viejo; la supervisión multi-agente es la nueva capa.
  • El loop es tan bueno como su feedback: revisión continua y gates de validación son lo que hace confiable a un loop.
  • El recurso caro se movió de tokens a gestión de loops: capeá iteraciones, detectá no-progreso, poné un techo de presupuesto.
  • La unidad reutilizable adentro del loop es un skill, no un prompt: loops que llaman skills afilados y con nombre componen; loops que re-derivan todo solo queman plata.

Investigación compilada de /last30days, 7 de junio de 2026. Fuentes: Reddit (17 voces, 47 threads, 34k upvotes), X (21 voces, 56 posts, 175 reposts), YouTube (4 voces), TikTok (6 voces, 34 clips), Instagram (4 voces, 14 reels), Hacker News (12 voces, 54 historias, 1k comentarios), GitHub (6 repos). Voces principales: steipete, bcherny, runes_leo, rohit_jsfreaky, MatthewBerman.

— Ariel Di Stefano