Databricks revoluciona el almacenamiento empresarial: una base de datos única para operaciones y análisis

En su Data + AI Summit, Databricks presenta LTAP, una innovadora arquitectura que integra bases de datos transaccionales y analíticas para potenciar el trabajo de los agentes de inteligencia artificial en las empresas.

En la reciente Data + AI Summit celebrada en San Francisco, Databricks ha presentado una innovación que podría transformar la manera en que las empresas gestionan sus datos. Se trata de LTAP (Lake Transactional/Analytical Processing), una nueva arquitectura destinada a eliminar la tradicional separación entre las bases de datos que manejan las operaciones del negocio y las que se utilizan para su análisis. Esta propuesta aspira a construir una infraestructura mucho más eficiente, pensada especialmente para los agentes de inteligencia artificial.

Tradicionalmente, las compañías han operado con dos tipos de bases de datos diferenciadas: los sistemas de procesamiento de transacciones en línea (OLTP), encargados de las operaciones en tiempo real como pedidos, cobros o inventarios, optimizados para escritura rápida; y los sistemas de procesamiento analítico en línea (OLAP), orientados a realizar informes y análisis mediante consultas eficientes sobre grandes volúmenes de datos en formato columnar. Estas dos capas de datos se mantenían separadas para garantizar un rendimiento y fiabilidad óptimos, conectándose a través de complejos procesos de extracción, transformación y carga (ETL).

Ali Ghodsi, cofundador y CEO de Databricks, explica que esta división ha sido durante décadas «un impuesto» que imposibilita la agilidad en los equipos de datos. La llegada de los agentes de IA, que pueden procesar y actuar sobre información en tiempo real a una velocidad inalcanzable para humanos, convierte esta separación en un cuello de botella que «LTAP se propone eliminar». Según Ghodsi, LTAP representa un avance largamente perseguido durante más de 40 años y que ahora finalmente han logrado materializar.

Patrocinado

Cómo funciona LTAP: un único almacenamiento, varios motores

La arquitectura LTAP unifica en una sola capa de almacenamiento los datos transaccionales y analíticos, manteniéndolos en formatos abiertos y gestionados de forma centralizada en almacenamiento en la nube tipo objeto. A partir de ahí, se utilizan motores computacionales diferenciados para cada tipo de procesamiento, permitiendo operaciones óptimas sin duplicar información ni perder consistencia.

Esta solución se apoyará en Lakebase, una base operativa basada en Postgres que Databricks presentó en 2025, diseñada para separar el cómputo del almacenamiento y mantener los datos en formatos abiertos dentro del lago de datos. Ahora, con LTAP, Lakebase se amplía para soportar cargas críticas de negocio, integrando funciones avanzadas como búsqueda vectorial y texto completo, ingestión de eventos en tiempo real a través del servicio Lakeflow Connect y un sistema de ramas al estilo Git que permite a los agentes crear copias para experimentar sin afectar el sistema original.

“A los agentes les encanta poder crear ramas y probar cosas rápidamente, sin tener que esperar diez minutos a que la base de datos esté operativa”, afirmó Ghodsi, subrayando la agilidad ofrecida por este diseño.

Lakehouse//RT: análisis en tiempo real sin duplicar datos

Complementando LTAP, Databricks presentó Lakehouse//RT, un motor de análisis en tiempo real que funciona directamente sobre las tablas Delta e Iceberg que alojan la información. Gracias a su motor vectorizado denominado Reyden, consigue latencias en consultas de milisegundos sin necesidad de crear capas separadas de datos o complicados procesos de replicación.

Esta tecnología reduce la necesidad de sistemas especializados para análisis en tiempo real que hasta ahora duplicaban datos, lo que implica costes y problemas de gobernanza. Según Mehrshad Setayesh, vicepresidente de ingeniería de PointClickCare, Lakehouse//RT opera un 33% más rápido que su almacén previo y multiplica por diez la velocidad de las consultas, eliminando la necesidad de un sistema de tiempo real adicional.

Adquisiciones clave para potenciar la innovación

La apuesta de Databricks por esta nueva arquitectura se ha apoyado en la compra de startups estratégicas, como el motor serverless Postgres Neon y Mooncake Labs, ambos adquiridos en 2025. Mooncake es esencial para acelerar las consultas analíticas al reflejar los cambios de Postgres en tiempo real dentro del lakehouse mediante una copia en formato columnar, aumentando la rapidez sin perder coherencia.

Además, Neon aporta funcionalidades exclusivas para agentes, como la capacidad de bifurcar una base de datos completa en segundos, facilitando pruebas y experimentos sin riesgos ni largos tiempos de aprovisionamiento que se observan en bases tradicionales.

El nuevo ecosistema para agentes de IA

Consciente del aumento exponencial de software automatizado por agentes de inteligencia artificial, Databricks prepara una infraestructura capaz de soportar esta demanda masiva. Al margen de LTAP, ha introducido Unity AI Gateway, una plataforma para controlar costes, modelos y agentes, con herramientas para asignar presupuestos, limitar tasas de uso y garantizar el acceso seguro mediante inicio de sesión único.

También lanzó Genie One, un agente generalista para equipos de negocio que se nutre de Genie Ontology, una capa que construye un grafo jerarquizado de datos empresariales empleando un algoritmo inspirado en PageRank llamado OntoRank.

Durante su presentación, Ghodsi subrayó la importancia de contar con bases de datos optimizadas para la nueva era de software generada por inteligencia artificial, señalando que en los próximos 12 meses se creará más código que nunca antes en la historia, y que todo ese código necesitará una base sólida detrás.

Nuevos productos y alianzas

Para sectores específicos, Databricks presentó CustomerLake, una plataforma de datos de clientes destinada a equipos de marketing. Además, anunció la adquisición de Panther, empresa de seguridad basada en Python, para integrar estas capacidades en su servicio Lakewatch de gestión de eventos e información de seguridad, reforzando así su oferta en este ámbito estratégico.

Ventajas competitivas y perspectivas

El valor diferencial de Databricks reside en su experiencia en ciencia de datos y en ofrecer una capa neutral y abierta que integra almacenamiento y cómputo, facilitando el desarrollo de agentes de inteligencia artificial sin comprometer la estructura ni generar duplicidades costosas. A diferencia de otros proveedores que utilizan sus propias plataformas cerradas, Databricks apuesta por formatos abiertos y gobernanza unificada, lo que atrae a empresas que buscan agilidad, escalabilidad y control de costes.

Para fortalecer su ecosistema, la empresa también impulsa protocolos como OpenSharing para facilitar el intercambio seguro de datos, modelos y capacidades entre plataformas, ampliando el alcance y uso colaborativo de la inteligencia artificial en el entorno empresarial.

En resumen, Databricks está construyendo una nueva infraestructura de datos diseñada para la era de la inteligencia artificial, donde los agentes son protagonistas y requieren soluciones que integren operaciones y análisis en tiempo real sin fricciones. Esta iniciativa promete reducir costes, mejorar la eficiencia y abrir nuevas posibilidades para la automatización avanzada en multitud de sectores.

Add a Comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Patrocinado