El equipo de Cohere ha sacado al mercado North Mini Code, un agente de codificación open source especialmente diseñado para flujos de trabajo agentivos en ingeniería de software. Este modelo, con 30.000 millones de parámetros y arquitectura mixture-of-experts (MoE), tiene la capacidad de activar solo 3.000 millones por token, lo que permite que funcione con eficiencia en apenas una GPU NVIDIA H100.
North Mini Code se presenta como una alternativa concreta y gratuita a las soluciones gestionadas líderes en el sector, como Claude Fable 5, aportando una autonomía de ejecución notable, ya que puede desplegarse localmente sin necesidad de depender de servicios en la nube. La principal contrapartida detectada en pruebas independientes es su tendencia a ser tres veces más prolijo en la generación de tokens, lo que puede impactar en coste y latencia en cargas de trabajo de alto volumen.
Características técnicas y capacidades del modelo
North Mini Code brinda un conjunto integral de prestaciones para la ingeniería de software agentiva. Cohere desarrolló este modelo desde cero, no como una adaptación de un modelo generalista, sino optimizado para la orquestación de sub-agentes, la revisión de código, el mapeo arquitectónico y la ejecución de tareas desde terminales.
Una de sus fortalezas es la gran ventana de contexto que maneja, con capacidad para procesar hasta 256.000 tokens, y generar fragmentos de código de hasta 64.000 tokens. Esto permite gestionar proyectos con múltiples archivos dentro de una misma sesión, favoreciendo una perspectiva holística del código y sus dependencias.
El modelo también está entrenado para operar en entornos de terminal, respondiendo a comandos shell, gestionando scripts y herramientas de línea de comandos. Ha sido evaluado en Terminal-Bench v2, que prueba agentes en contextos reales, lo que hace que sus resultados sean altamente relevantes para operaciones cotidianas en desarrollo software.
Innovación en su construcción y entrenamiento
Como modelo MoE, North Mini Code cuenta con 128 expertos y activa 8 de ellos por token para maximizar eficiencia. En cuanto al consumo computacional en inferencia, se asemeja a un modelo denso de 3.000 millones de parámetros, mucho más manejable que el tamaño total de sus parámetros.
Nick Frosst, cofundador de Cohere, demostró que el modelo puede operar en una Mac Studio con apenas 20 GB de RAM, la misma máquina que usa para trabajo local de programación, lo que subraya su potencial para despliegues personales o empresariales sin grandes infraestructuras.
El entrenamiento de este agente consistió en dos fases de afinamiento supervisado y una etapa final mediante aprendizaje reforzado con recompensas verificables, abordando más de 70.000 tareas verificables de aproximadamente 5.000 repositorios, filtrados para evitar duplicados con SWE-Bench.
Para aumentar la robustez, Cohere no se centró en un único tipo de agente, sino que entrenó North Mini Code utilizando tres marcos de trabajo distintos: SWE-Agent (con comandos CLI especiales), Mini-SWE-Agent (que usa bash y salida de shell sin formato) y OpenCode (herramientas que devuelven JSON estructurado). Este enfoque multimarco aportó una mejora del 10% en el rendimiento en las pruebas con OpenCode manteniendo buen desempeño en los demás escenarios.
Comparativa de mercado y ventajas competitivas
North Mini Code compite en un mercado con modelos como Mistral Devstral Small 2, GitHub Copilot, Cursor o Claude Fable 5, cada uno con sus particularidades en coste, implementación y capacidad.
En pruebas internas, Cohere asegura que North Mini Code supera a Mistral Devstral Small 2 en producción, con 2,8 veces más tokens generados por segundo y un 30% menos de latencia inter-token bajo las mismas condiciones de hardware. También superaría a otros modelos open source de hasta 120.000 millones de parámetros en métricas de rendimiento específicas.
Según Artificial Analysis, North Mini Code ocupa el octavo puesto en velocidad de salida entre 127 modelos comparables, con 210 tokens por segundo y un tiempo para el primer token de apenas 0,25 segundos (frente a la media de 1,95 segundos). Sin embargo, destaca también que produce una cantidad considerablemente mayor de tokens para completar tareas estándar (75 millones frente a una media de 25 millones), lo que puede elevar costes y latencias en escenarios de uso intensivo.
Implicaciones para empresas y usuarios profesionales
Con la llegada de North Mini Code, se establecen nuevas referencias para evaluar modelos de codificación agentiva. Es imprescindible que los proveedores aclaren si sus modelos han sido entrenados específicamente para tareas agentivas verificables o simplemente adaptados desde bases generalistas.
Además, la verbosidad en la generación de tokens emerge como un coste oculto, no reflejado en muchos benchmarks tradicionales, pero fundamental para calcular el verdadero impacto económico y técnico en pipelines de producción.
Por último, la elección entre modelos como North Mini Code y Claude Fable 5 también refleja un dilema arquitectónico real: optar por control de costes y soberanía tecnológica con despliegue local o delegar en infraestructuras gestionadas a cambio de mayor gasto y dependencia. Mientras la tarifa actual de Claude ronda los 50 dólares por millón de tokens generados, North Mini Code puede operar sin esos costes, únicamente con inversión en hardware.
Nick Frosst destaca esta filosofía con un mensaje claro: los grandes modelos de lenguaje deben evolucionar hacia configuraciones pequeñas, abiertas, transparentes y que puedan ejecutarse localmente, en contraposición a soluciones voluminosas, caras y cerradas.
En definitiva, North Mini Code supone un avance significativo para equipos que requieren agentes de codificación potentes, flexibles y económicamente accesibles, marcando tendencia en la democratización de la inteligencia artificial aplicada al desarrollo de software.