La empresa canadiense Cohere, reconocida por ofrecer soluciones de inteligencia artificial soberana a sectores regulados como bancos, gobiernos y proveedores sanitarios, da un paso hacia un nuevo público: los desarrolladores. Durante los últimos años, Cohere ha defendido que la IA debe operar en la infraestructura propia de las organizaciones, garantizando que los datos nunca salgan de sus perímetros, una ventaja crucial para industrias con estrictas normativas de protección y privacidad.
Ahora, esta firma especializada en modelos de lenguaje lanza North Mini Code, su primer modelo de IA enfocado en programación. Lo hace con una licencia abierta Apache 2.0 desde su lanzamiento, reforzando su compromiso con la soberanía y control absoluto de los usuarios sobre sus datos y sistemas.
Acceso al modelo como infraestructura propia
El argumento de soberanía que ha defendido Cohere durante años gira en torno a la propiedad y gestión directa del modelo de inteligencia artificial. En sectores regulados, existen requerimientos estrictos: los datos deben mantenerse dentro de fronteras controladas y la capa de inteligencia que procesa información sensible debe operar con total autonomía de la organización. Este principio ha guiado el desarrollo de productos de Cohere, siempre diseñados para ser desplegados en infraestructuras privadas o locales.
No obstante, según explica Nick Frosst, cofundador de Cohere, esta inquietud sobre la soberanía no solo la expresan las grandes empresas: ahora los desarrolladores individuales también muestran interés en controlar dónde y cómo se ejecutan los modelos de IA.
“Los desarrolladores están empezando a considerar el acceso a los modelos como parte de la infraestructura, y la infraestructura debe ser algo que poseas y controles. Esto es una extensión del concepto de soberanía.”
Para dar respuesta a esa demanda surge North Mini Code, un modelo de programación basado en la arquitectura Mixture of Experts (MoE) con 30.000 millones de parámetros, de los cuales solo 3.000 millones están activos en cada operación. Está optimizado para tareas complejas de codificación que requieren el uso de herramientas y ejecución de múltiples pasos, similar a los agentes de programación al estilo Claude Code y Cursor.
Este modelo puede funcionar en una única GPU Nvidia H100, lo que facilita su autoalojamiento sin necesidad de un despliegue multi-GPU complejo y costoso. Además, los desarrolladores que prefieran evitar administrar infraestructura propia pueden acceder a North Mini Code vía API.
“Queremos ofrecer a los desarrolladores un modelo potente, rápido y con pesos abiertos que puedan ejecutar localmente bajo sus propias condiciones, adaptado a sus entornos de cómputo.”
En pruebas de rendimiento, Cohere afirma que North Mini Code supera modelos similares de código abierto, como Qwen3 de Alibaba y Gemma 4 de Google, en el Índice de Codificación Artificial Analysis, donde alcanza una puntuación de 33,4. También asegura que su modelo ofrece hasta 2,8 veces más rendimiento que Devstral Small 2 de Mistral cuando se ejecuta en el mismo hardware.
Aunque en algunas pruebas especializadas, como SWE-Bench Verified y LiveCodeBench v6, Qwen 3.6 obtiene mejores resultados, Cohere destaca que estas diferencias son específicas y los datos deben considerarse indicativos.
Una tendencia en crecimiento
Cohere se suma a un creciente grupo de empresas internacionales que apuestan por modelos de programación de pesos abiertos como producto estratégico. Por ejemplo, la firma francesa Mistral presentó en 2025 su modelo Devstral y su versión mejorada Devstral 2, ambos con licencia Apache 2.0, destinados para tareas similares de agentes de programación. JetBrains, la conocida empresa checa de herramientas para desarrolladores, recientemente liberó como código abierto Mellum2, su modelo de segunda generación para programación.
Mientras Mistral subraya la relación directa entre pesos abiertos y la soberanía en IA para desplegar modelos en infraestructuras privadas, JetBrains destaca las ventajas en términos de menor latencia, costes ajustados y flexibilidad en el despliegue. En ambos casos, el objetivo común es otorgar a empresas y desarrolladores un mayor control sobre cómo y dónde se ejecutan los modelos.
Control real sobre la infraestructura
La demanda de alternativas de código abierto a los modelos punteros y propietarios es palpable. Ejemplo de ello es Lindy, plataforma de agentes de IA, que recientemente migró el 100% de su tráfico de inferencia de Anthropic a DeepSeek, un modelo desarrollado en China. Este cambio, además de ahorrar millones, mejoró el rendimiento en sus casos de uso principales. Lindy utiliza Atlas Cloud, un proveedor de inferencia estadounidense que aloja DeepSeek en territorio estadounidense; gracias a la naturaleza abierta del modelo, pueden elegir la jurisdicción y el proveedor que consideran más adecuados.
Frosst subraya esta ventaja: tener pesos abiertos implica libertad para decidir dónde se aloja y quién gestiona el modelo, un factor crucial para empresas cuyo coste en inferencia supera incluso el gasto en nóminas.
La línea Command de Cohere, su gama principal de modelos empresariales para tareas multilingües y multimodales, había sido distribuida antes con licencias más restrictivas. Sin embargo, con Command A+ en mayo pasado, la compañía migró a la licencia Apache 2.0, ampliando las libertades legales para su uso y redistribución.
“El desarrollo de código abierto estaba concentrado en unas pocas jurisdicciones y las organizaciones que operan infraestructuras críticas no tenían alternativas fiables.”
Frosst traza una conexión directa entre el argumento sobre la soberanía que Cohere ha mantenido para empresas y su nuevo modelo North Mini Code. Según explica, la concentración de desarrollo en pocos lugares y la falta de alternativas para infraestructuras críticas llevó a la compañía a extender el concepto al ámbito de los desarrolladores.
“A medida que los agentes de programación se convierten en la infraestructura sobre la que funciona la ingeniería de software, quien controle esos sistemas decidirá cómo operan, evolucionan y para qué se optimizan. Creemos firmemente que desarrolladores y empresas deberían tener ese control.”