La evolución más rápida en las herramientas para desarrolladores de inteligencia artificial esta semana nació a partir de una sencilla oferta de trabajo. Boris Cherny, responsable de Claude Code en Anthropic, sorprendió al afirmar que ya no se comunica con Claude a través de prompts directos. En su lugar, explicó que su función consiste en escribir bucles (loops) que gestionan el trabajo automáticamente. Este cambio de enfoque invita a programadores a diseñar sistemas que guían y controlan a sus agentes IA sin intervención continua.
El ingeniero de Google, Addy Osmani, popularizó este concepto al denominarlo oficialmente ‘loop engineering’, un método que rompe con el modo tradicional de interactuar con la inteligencia artificial como un asistente pasivo y la convierte en un trabajador autónomo capaz de ejecutar tareas continuadas mediante la orquestación inteligente de varios elementos: ejecuciones programadas, entornos aislados, agentes verificadores y memoria persistente.
Esta práctica implica un cambio profundo, similar a pasar de manejar un torno individualmente a diseñar toda la línea de producción que integra varios tornos trabajando coordinadamente. En un ‘loop’, el sistema identifica qué tarea ejecutar según un horario, usa un agente secundario para verificar la calidad del trabajo realizado y guarda el estado actual en archivos para asegurar que la siguiente sesión retome el trabajo exactamente donde se quedó.
Los bloques fundamentales del loop en dos plataformas líderes
El salto cualitativo de la ingeniería de bucles reside en que las piezas que permiten construir estos ciclos de trabajo ya no son meros scripts personalizados sino funciones incorporadas en productos de inteligencia artificial como Claude Code y Codex de OpenAI. Osmani ha identificado seis elementos primordiales, prácticamente iguales en ambos sistemas:
- Automatizaciones: descubrimiento y clasificación de tareas programadas. OpenAI gestiona esto mediante una pestaña específica y bandeja de entrada, Anthropic con tareas programadas, comandos internos y acciones en GitHub.
- Worktrees: espacios de trabajo aislados para agentes paralelos. OpenAI integra worktrees por hilo, mientras que Claude Code utiliza ‘git worktree’ para separar subagentes.
- Skills (habilidades): archivos que codifican el conocimiento del proyecto, con formato
SKILL.mden ambos ecosistemas. - Conectores: permiten interactuar con herramientas externas. OpenAI usa MCP (Machine Control Protocol) con plugins; Anthropic utiliza servidores MCP y plugins.
- Subagentes: separación entre quien crea el código y quien lo revisa, ubicados en directorios específicos de cada plataforma.
- Memoria: persistencia del estado entre ejecuciones, mediante características propias o integraciones externas como Linear.
Ambos sistemas permiten dar un objetivo concreto al agente mediante comandos /goal, para que este trabaje de forma continua hasta validar el alcance del resultado, siendo Claude Code el que añade un modelo independiente para evaluar el producto final.
La verificación dual: clave para la confianza
Uno de los cambios más decisivos en el ‘loop engineering’ es la separación de funciones entre el agente que escribe el código y el que lo verifica. Utilizar un único modelo para evaluar su propia labor es insuficiente por su tendencia a ser benevolente. Así, un segundo agente con instrucciones diferentes revisa rigurosamente para detectar fallos o desviaciones conceptuales que el primero pudiera haber pasado por alto.
Este enfoque ya se viene aplicando desde hace meses en infraestructuras especializadas, como el sistema Inspect de Ramp. Sin embargo, su reciente incorporación como característica nativa en productos líderes señala el paso definitivo hacia operaciones autonomizadas y cerradas (‘closed-loop’), donde el control de calidad es interno y continuo.
Desafíos operativos: costes, precisión y deuda cognitiva
En menos de dos años, la práctica ha evolucionado rápidamente desde la ingeniería de prompts hasta la ingeniería de loops. Si bien la capa de programación temporal aún se basa en tradicionalismos como ‘cron’, la decisión central está en la lógica del loop que examina datos actuales para decidir el siguiente paso, en contraposición a ejecutar secuencias fijas sin adaptaciones.
No obstante, Osmani advierte sobre riesgos importantes: las variaciones de costes en tokens pueden ser elevadas, y la ejecución autónoma sin supervisión puede propiciar errores no detectados. Además, señala la ‘deuda de comprensión’, que ocurre cuando se despliega código automático que nadie llega a revisar o comprender del todo. Esto puede resultar en divergencias en el ritmo y la calidad entre diferentes equipos que usan idénticos loops, según su nivel de entendimiento.
El futuro de la inteligencia artificial colaborativa
Los desarrolladores pueden comenzar con automatizaciones programadas simples que realicen tareas de triage combinadas con agentes verificadores, capturando una gran parte del beneficio sin necesidad de gastar excesivamente tokens. Plataformas como Cursor, Antigravity de Google y la nueva aplicación de GitHub Copilot ya orbitan en torno a agentes autónomos, aunque no han formalizado aún el concepto de loop como unidad básica de trabajo.
La verdadera diferencia radica en desplazar el foco desde el modelo hacia el ciclo completo que lo envuelve, donde la planificación, la verificación y la memoria asumen la responsabilidad de lo que realmente se entrega. En este contexto, la ingeniería de loops promete convertirse en la capa esencial para orquestar el desarrollo asistido por IA, y la empresa que logre hacer las definiciones de loops portables tendrá la ventaja decisiva para liderar el campo.