El auge desmedido de los tokens en IA toca a su fin y Revenium toma el control

Durante 18 meses, la adopción masiva y sin control de tokens en IA impulsó un fenómeno competitivo interno en las empresas que disparó gastos en la nube. Ahora, Revenium lanza una solución para identificar y optimizar el gasto en inteligencia artificial, ayudando a las organizaciones a controlar costes y mejorar el retorno de inversión.

En los últimos dieciocho meses, la implementación corporativa de la inteligencia artificial se ha vivido como una auténtica fiebre del oro. La consigna era sencilla: adoptar, integrar y escalar. Para los equipos de ingeniería, esto se tradujo en un acceso ilimitado e incontrolado a grandes modelos de lenguaje, lo que provocó una competencia interna inusual donde se valoraba y medía qué departamentos o ingenieros utilizaban más tokens. Este fenómeno, conocido como tokenmaxxing, se caracterizaba por un entusiasmo desmedido que carecía de correspondencia con resultados comerciales tangibles.

Para entenderlo, los tokens en IA son las unidades básicas de datos — fragmentos de palabras, signos de puntuación o píxeles — que los modelos lingüísticos usan para procesar y generar información. En inglés, un token equivale aproximadamente a tres cuartas partes de una palabra o cuatro caracteres. Estos tokens definen los límites contextuales del modelo, su rendimiento y, muy importante, la facturación del API.

Sin embargo, esta etapa de crecimiento acelerado y consumo masivo de tokens, promovida por la dirección corporativa para potenciar el «ingrediente secreto» de la IA, está llegando a su fin. Lo que ahora enfrentan las empresas es una resaca en forma de facturas inmensas e imprevistas en la nube.

Patrocinado

“Puedes gastar (mucho) dinero sin hacer nada realmente útil.”

Así lo señala Jason Cumberland, cofundador y director de producto de Revenium, empresa con sede en Herndon, Virginia. Cumberland explica a The New Stack que la realidad de los costes ha comenzado a cambiar la perspectiva empresarial:

“El mundo se volvió loco y después aterrizó. Hemos sido testigos de ello y nos parece una locura. De verdad, puedes gastar mucho dinero sin lograr resultados útiles.”

Con la evolución de la IA, los gastos dejaron de ser solo presupuestos experimentales para convertirse en cifras concretas que impactan el balance económico de las empresas. Como consecuencia, los líderes corporativos han cambiado su estrategia, pasando de una expansión irreflexiva a un control riguroso. Aquí es donde Revenium — especializada inicialmente en monetización de APIs — ha aprovechado la oportunidad para posicionarse con una herramienta avanzada de observabilidad adaptada al control económico de la IA.

Recientemente, Revenium lanzó un nuevo módulo llamado AI Insights, integrado en su Sistema de Control Económico de IA, que permite detectar y recuperar presupuesto desperdiciado en IA. Mediante un análisis exhaustivo de los históricos de transacciones con un proceso de detección multifásico, esta herramienta genera una lista de recomendaciones de optimización, ordenadas por impacto económico y enlazadas directamente a los datos de transacciones implicados. Este enfoque resuelve una problemática común en muchas organizaciones: la imposibilidad de extraer información práctica de un mar de datos complejos.

En pruebas beta, AI Insights reveló ineficiencias significativas, como dependencias circulares costosas en solicitudes de agentes, uso de modelos anticuados y caros, o altas tasas de fallo con determinados proveedores. Estas vulnerabilidades son priorizadas en función de su potencial de ahorro mensual, lo que proporciona a los ingenieros una guía clara para abordar rápidamente las correcciones más rentables. En lugar de depender únicamente de dashboards básicos, Revenium automatiza la identificación y jerarquización del despilfarro, facilitando acciones concretas que impactan directamente en el resultado financiero.

El origen API de la observabilidad en IA

Durante los primeros años de su trayectoria, Revenium se centró en la monetización de APIs, colaborando con gigantes como Salesforce y Mulesoft. Cuando la burbuja de la IA generativa empezó a expandirse, la empresa comprobó que su infraestructura para el seguimiento de transacciones API de alto volumen era perfecta para adaptarse a la economía de la IA.

“La inteligencia artificial es, en esencia, APIs”, comenta Cumberland. “Nos dimos cuenta de que el motor de medición que habíamos desarrollado podía aportar un gran valor en el contexto de la IA.”

A diferencia de herramientas típicas de FinOps, como CloudZero, Revenium aborda el problema desde la instrumentación en tiempo real. Su código se ejecuta durante las transacciones API, midiendo el consumo al instante y permitiendo detener procesos si se superan los límites presupuestarios, evitando así los retrasos habituales al esperar las facturas.

El problema iceberg

Cumberland ilustra el desafío organizativo mediante la metáfora del “gráfico iceberg”. La mayoría de las empresas solo observan el gasto visible en tokens, que representa la punta del iceberg. Bajo la superficie, sin embargo, se esconden costes asociados a sistemas y servicios downstream, como Snowflake, Stripe o proveedores de identidad externa. Estos costes adicionales a menudo permanecen desconectados y no vinculados al agente de IA que los generó.

“Imaginemos un agente encargado de procesar créditos. En esa función puede realizar llamadas API a servicios externos como Equifax o TransUnion. Cada informe de crédito puede costar unos 25 dólares. La empresa recibe una factura por tokens del proveedor LLM y otra de Equifax, pero sin saber que un agente descontrolado genera un gasto elevado.”

El sistema de Revenium intentará eliminar estos silos, creando un modelo de datos que relacione el coste de servicios externos con cada agente que los ha activado, proporcionando así una visión completa y precisa de los costes.

Los tres horizontes de madurez en la adopción de IA

Para Cumberland y su equipo, la evolución hacia un uso responsable de la IA se puede dividir en tres etapas:

  • Atribución: Nivel básico para identificar cómo se distribuye el gasto, qué proveedores están involucrados y qué unidades o agentes consumen tokens. Facilita pasar de facturas opacas a datos claros y accionables.
  • Asociación con sistemas downstream: Resuelve el problema iceberg conectando los costes de agentes IA con las infraestructuras y servicios externos que utilizan, logrando una visión integral del coste real.
  • Análisis de retorno y resultados: Etapa avanzada que va más allá del gasto bruto para determinar la rentabilidad y el impacto, midiendo la eficacia frente a los procesos humanos correspondientes.

En esta última etapa, Revenium mide el rendimiento comparativo entre IA y flujos de trabajo manuales, registrando el tiempo humano invertido en reparar o supervisar agentes. “Cuando un agente falla y hay que intervenir manualmente, no solo se suman costes en tokens, sino también tiempo humano, y nosotros ayudamos a controlar ambos.”

Hacia la gestión de la fuerza laboral IA

Un aspecto revolucionario de la visión de Revenium es su enfoque en el manejo y desempeño de los agentes de inteligencia artificial, un paralelismo con la gestión tradicional de empleados.

“Estoy convencido de que en el futuro, las revisiones de desempeño incluirán preguntas como: ‘¿qué tan bien hiciste tu trabajo y cuántos tokens gastaste?’”, asegura Cumberland.

Por ahora, el urgente interés está motivado por la necesidad financiera. A medida que los responsables empresariales entienden que implantar IA sin observabilidad es “volar a ciegas”, crece la demanda de sistemas de control como el que ofrece Revenium. El objetivo no es frenar la innovación, sino sustituir la peligrosa mentalidad de competir por el máximo consumo de tokens por una gestión basada en métricas que reflejen la realidad económica.

En un ecosistema tecnológico fundado en la eficiencia, el siguiente paso lógico consiste en cuantificar el valor real que aporta la inteligencia artificial. Para Revenium, el futuro de la IA no solo reside en la generación de datos, sino en cómo impacta eficazmente en la línea de resultados empresariales.

Add a Comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Patrocinado