Tecnología

DeLM de Stanford revoluciona el trabajo colaborativo entre agentes de IA y reduce a la mitad los costes sin director central

El nuevo modelo descentralizado de Stanford, DeLM, permite que agentes de IA cooperen directamente sin necesidad de un controlador central, mejorando la eficiencia, precisión y reduciendo los costes de coordinación en tareas complejas.

por

junio 17, 2026

Los sistemas actuales de inteligencia artificial suelen operar bajo la premisa de que sus agentes necesitan un “director” central que organice, distribuya tareas y evite el caos en las operaciones conjuntas. Sin embargo, un equipo de Stanford ha demostrado que esta dependencia puede ser obsoleta y hasta perjudicial tanto en costes como en rendimiento.

La innovación presentada es DeLM (Decentralized Language Model), un marco que permite a los agentes comunicarse y colaborar directamente sin necesidad de pasar cada actualización por un agente principal que centralice la información. Este enfoque descentralizado se basa en una base común de conocimientos compartidos donde se registran hallazgos verificados, fracasos documentados y detalles relevantes que pueden ser consultados por cualquiera de los agentes según las tareas que tengan asignadas.

Según Yuzhen Mao y Azalia Mirhoseini, creadores de DeLM, este sistema evita el tradicional cuello de botella evitado con orquestadores centrales. Los agentes pueden evitar repetir errores, mantener restricciones específicas y acceder a evidencias solo cuando es necesario, lo que reduce la latencia y aumenta la efectividad del conjunto.

Los obstáculos de los sistemas de agentes centralizados

Los sistemas convencionales fragmentan las tareas en subtareas que son distribuidas y luego reunidas por un agente principal, que fusiona la información y dirige las siguientes fases del trabajo. Este método se vuelve ineficiente conforme crecen las tareas: el agente central se convierte en un cuello de botella que ralentiza la comunicación y puede distorsionar o perder información crucial.

Además, durante tareas de razonamiento extensas o en contextos largos, el agente central agrupa apresuradamente conceptos y datos, asignando estas agrupaciones antes de verificar si son realmente relevantes o correctas. Esto provoca confusión en los agentes subordinados, generando ciclos repetitivos de consulta y delegación que deterioran la coordinación, según los investigadores.

¿Cómo funciona DeLM?

DeLM reorganiza la dinámica incorporando tres elementos esenciales: agentes trabajando en paralelo, un contexto compartido y una cola de tareas que los agentes pueden reclamar libremente.

El contexto compartido funciona como un repositorio curado de “resúmenes” —o gistings— que condensan hallazgos comprobados, fracasos y restricciones, junto con indicaciones a evidencias detalladas necesarias para tareas específicas. La cola de tareas lista subtareas pendientes que pueden ser tomadas por cualquier agente, fomentando la autonomía y la cooperación simultánea.

El proceso se ejecuta en estas fases:

Inicio: Las entradas se descomponen en unidades de trabajo y se añaden a una cola.
Ejecutar en paralelo: Los agentes toman tareas de la cola y consultan el contexto compartido mientras avanzan.
Compresión y verificación: Los resultados se sintetizan en gistings que solo se comparten una vez verificados.
Trabajo adicional: Al vaciarse la cola, el último agente evalúa si se necesita más trabajo.
Conclusión: El último agente determina que la tarea está completa y entrega la respuesta final.

Este modelo permite que los agentes intercambien progreso de forma asíncrona, evitando saturar a cualquier entidad central y facilitando una escalabilidad más fluida conforme aumenta la complejidad.

Resultados y aplicaciones de DeLM en escenarios reales

DeLM demuestra gran eficacia especialmente en entornos de ingeniería de software donde es crucial mejorar el razonamiento y la capacidad de resolución de problemas de los modelos a tiempo real. El marco facilita tareas como la depuración simultánea, donde varios agentes exploran hipótesis en paralelo y comparten avances intermediarios, evitando redundancias y acelerando la solución.

También destaca en contextos de razonamiento con documentos extensos o multi-documentales, ya que los agentes pueden analizar en paralelo diferentes colecciones de evidencias mientras mantienen una visión global condensada.

En pruebas de alto nivel, DeLM logró superar al mejor modelo base en SWE-Bench Verified, una evaluación de resolución de problemas reales en ingeniería de software, alcanzando un 10,5% más de precisión y reduciendo los costes de tareas a la mitad. En la prueba LongBench-v2 Multi-Doc QA, que mide la capacidad para manejar problemas con contexto extenso, DeLM consiguió la mayor exactitud entre cuatro familias de modelos populares como GPT-5.4 y Claude Sonnet.

Ventajas claves del enfoque descentralizado

Según Mao, uno de los principales beneficios es que los agentes comparten los fracasos entre sí. En enfoques paralelos tradicionales, un error queda relegado a un agente, haciendo que otros repitan caminos infructuosos, aumentando tiempo y gasto. En cambio, DeLM almacena esos errores como restricciones en el contexto común, guiando a futuros agentes a evitar esos callejones sin salida.

Las restricciones verificadas se añaden y se vuelven vinculantes para todos los agentes, impidiendo que se repitan simplificaciones erróneas a nivel global. Además, la manera en que se guardan los progresos es compacta pero ampliable: los agentes pueden acceder a resúmenes breves y optar por desplegar detalles y evidencias si la tarea lo requiere.

Esto es esencial para equilibrar información suficiente y evitar sobrecargar los sistemas con datos extensos —una sobrecarga que transformaría la coordinación en otro cuello de botella. A la vez, evita la pérdida de detalles importantes que podría comprometer la calidad del razonamiento.

En resumen, DeLM logra optimizar la eficiencia al impedir que los agentes repitan análisis fallidos, mejora la fiabilidad propagando solo información verificada, y aumenta la capacidad de respuesta compartiendo progresos útiles entre hilos de trabajo paralelos.

Este avance desafía la creencia tradicional de que los flujos de trabajo multiagentes necesitan un controlador único. Según los resultados obtenidos, el modelo descentralizado no solo es una teoría más elegante, sino que resulta ser más rápido, preciso y aproximadamente un 50% más económico en la práctica.