A medida que los modelos de lenguaje evolucionan más allá de simples chatbots hasta convertirse en agentes autónomos capaces de razonar, planificar y ejecutar acciones, están empezando a gestionar sistemas de aplicaciones complejos sin intervención humana. Sin embargo, el mayor reto que enfrentan estos agentes está en un componente fundamental y a la vez implacable: las bases de datos.
Andy Pavlo, profesor asociado de Ciencias de la Computación en la Universidad Carnegie Mellon, puso de manifiesto durante la conferencia Percona Live 2026 celebrada en el Computer History Museum de Mountain View, California, que las bases de datos plantean el desafío más arduo y crucial para los agentes autónomos debido a sus estrictos requisitos de corrección y rendimiento.
“Una base de datos no perdona errores. Si un agente genera un componente de interfaz con errores, puede que la página se vea ligeramente desajustada; pero si se equivoca con una consulta o cambia la configuración en una base de datos en producción, todo el sistema puede colapsar”, explicó Pavlo.
La batalla entre agentes especializados
En el campo de la inteligencia artificial aplicada a bases de datos, Pavlo distingue dos tipos principales de agentes: los agentes de afinación y los agentes de codificación. Los primeros buscan automatizar la optimización de bases de datos, esa mezcla compleja y casi mística que implica ajustar configuraciones, crear índices y seleccionar estrategias de ejecución para mejorar la latencia y el rendimiento general, tareas que tradicionalmente requieren años de experiencia de un administrador de bases de datos (DBA).
El problema es que estos agentes suelen funcionar de manera aislada. Un agente que ajusta parámetros puede desconocer lo que hace otro que configura índices, lo que resulta en optimizaciones parciales y subóptimas. Para hacer frente a esta fragmentación, el equipo de Carnegie Mellon trabaja en métodos de afinación secuencial y multi-ronda que coordinan diferentes agentes para lograr resultados globalmente mejores, aunque el espacio de búsqueda para encontrar la configuración perfecta crece de forma exponencial, lo que complica aún más la tarea.
El poder y límite de los agentes de codificación
En paralelo, los agentes que generan código se han convertido en grandes aliados para el desarrollo de bases de datos. Según Pavlo, los alumnos de CMU han incrementado notablemente la cantidad de código entregado en proyectos tras la incorporación de estos agentes, ya que son capaces de reproducir estructuras de datos habituales como árboles B+, tablas hash y gestores de memoria cache, basándose en implementaciones estándar presentes en documentación y repositorios abiertos.
No obstante, uno de los mayores retos sigue siendo el optimizador de consultas—un componente complejo, muy ligado al sistema específico para el cual fue diseñado y que rara vez cuenta con referencias modulares y abiertas. Además, demostrar que una regla de transformación generada por IA mantiene la semántica correcta, es decir, que produce resultados equivalentes pero con mayor eficacia, sigue siendo un problema abierto.
Los riesgos de implementar agentes en bases de datos
El salto hacia la gestión autónoma de bases de datos no está exento de peligros. Líderes de la industria como Pavlo y Peter Zaitsev, cofundador de Percona, advierten sobre las vulnerabilidades en estabilidad y seguridad que implica delegar funciones críticas en agentes autónomos. Se han reportado incidentes en los que un agente, al interactuar con una base de datos, ha eliminado datos esenciales o ha filtrado información sensible por no comprender correctamente las complejas reglas de acceso y control.
Además, los modelos de lenguaje sufren lo que se denomina “alucinaciones” de IA, en las que generan código muy específico para una consulta o escenario concreto, pero que no generaliza bien. Por ejemplo, un agente podría optimizar correctamente una cláusula para extraer el año de una fecha, pero romper la estructura interna al intentar extraer el mes, lo que limita la robustez de la automatización.
La automatización como apoyo, no reemplazo
A pesar de estas dificultades, Pavlo confía en un modelo que denomina Agent Operator, donde los agentes autónomos se encargan de las incidencias urgentes y de la resolución rápida de problemas a altas horas de la madrugada, mientras que los humanos continúan liderando el diseño arquitectónico y estrategias a largo plazo. Gracias a técnicas de impulso basadas en datos de bases de datos previamente optimizadas, se ha conseguido reducir el tiempo necesario para afinar un sistema de 12 horas a menos de 15 minutos.
Para Pavlo, el objetivo más ambicioso no es solo tener una IA que escriba código, sino desarrollar un sistema que sea capaz de evaluar y razonar sobre su propio rendimiento y corrección. En definitiva, considera que la base de datos representa el espacio de conocimiento central para cualquier agente autónomo y que dominar su gestión autónoma es la piedra angular para avanzar en sistemas verdaderamente autónomos y confiables.
“Si queremos sistemas autónomos, primero debemos dominar el arte implacable de la base de datos autónoma.”