El mayor obstáculo para la implementación sostenible de la inteligencia artificial en la actualidad es el coste asociado a la inferencia, es decir, el gasto necesario para ejecutar los modelos de IA. Recientemente, GitHub decidió abandonar su tarifa plana para la suscripción de Copilot, optando por un sistema basado en el uso real. Esta medida respondió a un aumento significativo en los costes ocasionados por largos periodos de codificación mediante agentes, que generaban facturas mucho más elevadas que la cuota fija mensual prevista. Paralelamente, Uber agotó en apenas cuatro meses el presupuesto que tenía asignado para IA en 2026, destinado principalmente a utilizar Claude Code, haciendo que su director operativo pusiera en duda la rentabilidad de dicha inversión.
En este contexto de preocupación generalizada, la Linux Foundation lanzó la Tokenomics Foundation, respaldada por gigantes como Google, Microsoft, IBM y Salesforce, entre otros. Esta iniciativa busca establecer estándares abiertos para el coste de los tokens de IA, dado que actualmente las empresas carecen de herramientas uniformes para medir y controlar lo que deben pagar al utilizar estos sistemas.
El cambio radical en Lindy
Para compañías que gestionan un elevado volumen de agentes de IA, la economía de los modelos vanguardistas es una cuestión crucial para su viabilidad. Lindy, una plataforma no-code fundada en 2023 por Flo Crivello, ingeniero y ex responsable de producto en Uber, automatiza tareas diarias como la gestión de correos electrónicos, programación de reuniones y administración de CRM. Lindy nació como una evolución del anterior proyecto de Crivello, Teamflow, una startup de oficinas virtuales, que llegó a recaudar 52 millones de dólares y que ahora financia el desarrollo de Lindy.
La semana pasada, Crivello anunció en redes sociales que Lindy había migrado por completo su infraestructura de modelos de IA desde Anthropic a DeepSeek. Según sus palabras, este cambio ha representado un ahorro de millones de dólares y, simultáneamente, una mejora en el rendimiento en muchos casos de uso esenciales.
Meses antes, Crivello ya había adelantado que el coste de la inferencia superaba incluso a la nómina de la empresa, y que en apenas un año los modelos open source habían alcanzado un nivel competitivo con los productos comerciales de vanguardia, algo impensable anteriormente. Lindy llegó a considerar modelos como Kimi K2.5, desarrollado por Moonshot AI de China, o GLM-5.1, de Zhipu AI en Pekín, antes de decantarse finalmente por DeepSeek v4, el buque insignia de la empresa china DeepSeek.
La transición no fue sencilla ni rápida. Crivello asegura que el proceso de evaluación y migración requirió de entre seis y nueve meses, y que el esfuerzo fue cien veces mayor de lo esperado inicialmente. Esta tarea incluyó pruebas exhaustivas, tanto en línea como fuera de línea, análisis de impacto en la retención de usuarios y ajustes constantes en las indicaciones dirigidas al nuevo modelo.
Los resultados, sin embargo, justificaron la inversión, especialmente en tareas críticas como la gestión del correo electrónico y la elaboración previa de respuestas según el tono del usuario. Aunque DeepSeek todavía no iguala a Anthropic en algunas automatizaciones complejas de flujos de trabajo, ha demostrado ser suficiente para las prioridades de Lindy.
El fenómeno DeepSeek
Para comprender la relevancia de este cambio, es fundamental conocer el impacto que DeepSeek ha tenido en la industria de la IA. En enero de 2025, su modelo R1 sorprendió a Silicon Valley al igualar el rendimiento de los principales modelos estadounidenses de frontera, pero con costes mucho menores. Esto provocó una caída abrupta en la cotización de Nvidia, ya que se cuestionaron las necesidades de computación que hasta entonces se daban por sentadas. Desde entonces, DeepSeek ha evolucionado constantemente, acercándose cada vez más al nivel de los modelos más avanzados.
La versión DeepSeek V4, lanzada en preview en abril de 2026, supuso un avance notable no solo por su precio competitivo. Según Marcel Salathé, profesor y codirector del Centro de IA de EPFL en Suiza, V4 marca un hito desde el punto de vista geopolítico al ofrecer una pila completa de IA desarrollada en China, incluyendo procesadores, frameworks y modelos. DeepSeek incluso reescribió su plataforma para funcionar sobre CANN, la alternativa china a CUDA de Nvidia, reduciendo así su dependencia de infraestructuras estadounidenses.
Esta transformación geopolítica tiene implicaciones directas en el mercado comercial. El abanico de modelos de IA actuales se ha dividido en dos sectores muy diferenciados: por un lado, modelos exclusivos y de altísimo nivel, como los de OpenAI o Anthropic; y por otro, modelos con pesos abiertos y costes mucho menores, generalmente provenientes de laboratorios chinos. Esta polarización obliga a empresas con grandes consumos de tokens, como Lindy, a tomar decisiones estratégicas sobre qué modelo utilizar, dado que sus facturas pueden superar los salarios del equipo.
Para alojar DeepSeek v4, Lindy optó por Atlas Cloud, un proveedor estadounidense que ofrece el modelo en servidores ubicados en Estados Unidos. Esta decisión responde a preocupaciones típicas sobre la soberanía de los datos cuando se usan modelos desarrollados en China. Crivello afirmó que Atlas fue el proveedor que mejor se ajustó a sus requisitos tras evaluar múltiples opciones, descartando la posibilidad de alojarlo internamente debido a la complejidad y distracción que esto supondría.
Impacto económico y futuro
Aunque Crivello se reserva detalles, indica que el cambio permitirá a Lindy ahorrar millones de dólares, enormemente significativo para una empresa financiada por capital de riesgo. Sobre la permanencia de este cambio, el CEO se muestra prudente y señala que nada es definitivo: «No me sorprendería que la próxima versión de Anthropic nos hiciera volver a sus servicios, pero tendrían que reducir sus precios considerablemente.»
Por otra parte, Lindy continúa siendo cliente de Anthropic para uso interno, donde la estructura de tarifas resulta más viable. Si tuvieran que pagar por token completo en estos casos, también cambiarían de proveedor. Además, para casos en los que el modelo DeepSeek no rinda adecuadamente, la empresa contempla escalar consultas a Opus, otro modelo de Anthropic, aunque esperan que este uso sea marginal.
Crivello subraya que para empresas con un elevado consumo de tokens es imprescindible explorar alternativas más económicas: «Para compañías como la nuestra que gastan mucho, sería irresponsable no buscar opciones. Otras empresas pueden preferir mantener la marca de siempre, pero creemos que muchos acabarán buscando modelos más accesibles.»