En el primer trimestre de 2026, una investigación de VentureBeat puso de manifiesto el llamado “Espejismo de la Gobernanza” en inteligencia artificial (IA) empresarial: una desconexión importante entre los organigramas de gobernanza diseñados por las empresas y las capas reales de control efectivas instauradas. Mientras el 43 % de las organizaciones afirmaban que un equipo central tenía la responsabilidad sobre esta gobernanza, el 23 % no lograba ponerse de acuerdo sobre quién era realmente el dueño de estas funciones, y un 31 % señaló la opacidad de los proveedores como la mayor barrera.
Este nuevo estudio profundiza y pregunta qué falla primero cuando las compañías intentan resolver ese problema de gobernanza. La respuesta es clara y contundente: no son los modelos de IA los que colapsan, sino la infraestructura de ejecución, conocida como runtime.
Las empresas están descubriendo que los agentes de IA basados en arquitecturas sin estado —como scripts en Python, encadenamientos con LangChain o coordinaciones improvisadas— no soportan las demandas operativas de producción. Reinicios de contenedores borran el contexto, los costes de tokens superan las expectativas financieras, y las alucinaciones que surgen en etapas tempranas se acumulan para convertirse en fallos catastróficos en procesos más largos. La mayoría de los equipos de ingeniería invierten más tiempo en gestionar esta “plomería técnica” que en desarrollar la inteligencia que justifique la inversión.
Este problema crítico plantea un camino divisorio para las organizaciones: aquellas que prioricen la durabilidad y resiliencia del runtime como un concernimiento central en ingeniería serán las que sobrevivan a este momento de reckoning o ajuste de cuentas, mientras que otras quedarán atrapadas, igual que ocurrió con la automatización robótica de procesos (RPA) hace una década, convertidas en un cementerio de pilotos prometedores que no lograron superar el segundo día de producción.
Metodología del estudio
Este análisis se basa en una encuesta realizada por VentureBeat en mayo de 2026 en el marco de su serie Pulse Research sobre la adopción de agentes AI en empresas. Los participantes fueron cuidadosamente seleccionados para incluir exclusivamente líderes tecnológicos verificados y con alta experiencia en la implementación de agentes de IA, pertenecientes a organizaciones de 100 o más empleados. El total del panel fue de 132 encuestados.
Los perfiles profesionales abarcan desde directores y vicepresidentes de IA, datos o ingeniería, hasta CIOs, CTOs, CISOs, gerentes de producto y programación, consultores, ingenieros de software y arquitectos empresariales. Los sectores representados incluyen tecnología/software (42 %), servicios financieros (20 %), servicios profesionales (8 %), salud y ciencias de la vida (7 %), comercio minorista y consumidor (6 %), educación (4 %) y otros.
Respecto al tamaño organizacional, el 35 % de la muestra pertenece a grandes empresas (+10.000 empleados), el 48 % a compañías medianas-grandes (500-9.999 empleados) y el 17 % restante a empresas en crecimiento (100-499 empleados).
Principales hallazgos
1. El problema central es el runtime, no el modelo
La discusión fundamental sobre la IA en 2026 gira en torno a si los fallos se deben a la capacidad de razonamiento del modelo (el “cerebro”) o a limitaciones en la infraestructura de ejecución —el “espinazo” o columna vertebral— encargada de gestionar el estado, tolerar fallos y coordinar la ejecución. El 17 % de los encuestados sigue señalando problemas en el modelo como la principal causa, pero la mayoría apunta claramente a deficiencias en el runtime y en la gobernanza.
Esto revela que, aunque los modelos de IA como GPT-5 o Claude 4.7 cuentan con la inteligencia suficiente para los flujos de trabajo, es la infraestructura la que no está a la altura para soportar los retos operativos de largo plazo.
“Los modelos son suficientemente inteligentes, pero nuestra infraestructura sin estado es demasiado frágil para procesos multilaterales y prolongados.”
— Director de Ingeniería / IT, sector financiero, empresa de 10.000 a 49.999 empleados
2. El coste de construir soluciones propias consume la capacidad de ingeniería
El tiempo que los equipos destinan a crear y mantener la infraestructura necesaria para la durabilidad (reintentos, persistencia de estado, puntos de control) sobrepasa el dedicado a desarrollar la lógica inteligente de los agentes. Un 77 % dedica una parte significativa de su capacidad a esta “plomería”, lo que ralentiza el avance en funcionalidad real. Solo un 23 % ha conseguido liberarse de esta sobrecarga, probablemente por contar con plataformas gestionadas que facilitan la fiabilidad.
3. La pérdida de memoria del estado es la principal causa técnica de fracaso en producción
Entre los obstáculos técnicos destacados, la “amnesia de estado” ha cedido protagonismo al sobrecoste económico y la propagación de errores de razonamiento (alucinaciones). Las alucinaciones silenciosas se agravan en procesos de múltiples pasos, y las “fallas fantasma” —errores invisibles sin traza— son más frecuentes de lo calculado.
4. La visibilidad y observabilidad penalizan especialmente a Microsoft
La investigación evidencia que el ecosistema de Microsoft —especialmente Azure y Copilot— requiere mayor esfuerzo en personalizar instrumentación y gestionar telemetría para diagnosticar y controlar fallos, imponiendo el “impuesto de observabilidad” más alto. Esto confirma advertencias previas acerca del riesgo de depender exclusivamente de una única nube y sus herramientas nativas, lo que limita el control real de las empresas.
5. El desfase entre marketing y realidad técnica afecta más a OpenAI y Microsoft
Los usuarios perciben una desconexión significativa entre las promesas de autonomía y confiabilidad de plataformas líderes y su rendimiento real en entornos de producción. Microsoft encabezó las críticas con un 45 %, seguido por OpenAI con un 22 %, reflejando frustraciones específicas ligadas a la orquestación multiagente aplicada a escala.
6. La seguridad se construye desde cero y con múltiples enfoques
Las empresas no esperan a los proveedores para proteger la información sensible, usando diferentes métodos como la política como código, identidad no humana (NHI) o sandboxing con bloqueo de egreso. Aunque el sandboxing es la más técnica y menos extendida, crece rápidamente dado el acceso creciente de agentes a sistemas empresariales críticos, representando una defensa crucial contra ataques basados en la ejecución de código malicioso.
7. La migración hacia infraestructuras duraderas es ya una realidad fragmentada
El 20 % de los encuestados se aferra todavía a arquitecturas sin estado, confiando en parchear los problemas con mejores indicaciones y reintentos manuales, un enfoque que ha demostrado ser insostenible. Por otro lado, el 59 % ya está en proceso activo de migración hacia frameworks que garantizan la persistencia de estado y la durabilidad, lo que marca la vanguardia en la evolución de la infraestructura AI.
8. La orquestación poliglota domina la estrategia arquitectónica, pero sin consenso absoluto
Frente a cuatro apuestas arquitectónicas propuestas, la mayoría apuesta por combinar modelos de razonamiento con arquitecturas deterministas para garantizar precisión y ejecución crítica. La heterogeneidad explicaría en parte la persistencia de problemas en gobernanza y observabilidad, que exigen plataformas unificadoras para monitoreo integral.
9. La tasa de aceptación humana es el estándar emergente para evaluar agentes
Las empresas están gravitando hacia métricas que reflejan la confianza humana en las respuestas del agente, más que indicadores técnicos como velocidad o memoria de contexto. El 48 % ahora valora especialmente la fidelidad al contexto, reflejo de la importancia de la duración y coherencia de memoria a lo largo de días para aplicaciones prácticas.
Conclusión
Los datos sugieren que el gran desafío para los agentes AI en la empresa es la durabilidad del runtime, no la inteligencia de los modelos. La complejidad y el coste operativo están dejando poco margen para abordar los problemas de manera sostenible, obligando a las organizaciones a replantear sus infraestructuras y a diferenciar entre la inteligencia del modelo y la robustez de la plataforma que lo sustenta. Sólo quienes adopten arquitecturas resistentes y observables podrán avanzar más allá de la fase piloto y maximizar el retorno de inversión en IA.
Este análisis se basa en respuestas de 132 profesionales tecnológicos líderes en empresas con más de 100 empleados. Los datos, aunque indicativos, reflejan tendencias claras en la evolución de la infraestructura AI empresarial en 2026.