El renacer del procesador CPU en la era de los agentes de inteligencia artificial

Aunque las GPUs y TPUs suelen acaparar la atención en la infraestructura de IA, los procesadores CPU están ganando protagonismo al gestionar tareas críticas de los agentes autónomos más allá de los chatbots convencionales.

En el debate sobre la infraestructura de la inteligencia artificial, la atención se centra casi siempre en las unidades de procesamiento gráfico (GPUs) y en los Tensor Processing Units (TPUs). Sin embargo, existe un actor fundamental que ha quedado en segundo plano, pero cuya importancia está aumentando a medida que la IA evoluciona desde simples chatbots hacia agentes autónomos: el procesador central o CPU.

Para profundizar en esta perspectiva, The New Stack conversó con Bhumik Patel, responsable del ecosistema software para la nube e inteligencia artificial en Arm, y con Mo Farhat, líder de gestión de producto para Axion y máquinas basadas en Arm en Google Compute Engine. Ambos coinciden en destacar que el CPU sigue siendo un elemento crucial, actuando como un verdadero controlador de tráfico aéreo en la orquestación de las tareas que requieren los agentes de IA.

De responder a actuar: el nuevo reto del CPU

Los primeros chatbots se limitaban a recibir preguntas y devolver respuestas. En cambio, los agentes actuales son capaces de actuar proactivamente: ejecutan tareas usando distintas herramientas e incluso crean entornos de ejecución para el código que generan. Mo Farhat explica que este tipo de trabajo computacional corresponde fundamentalmente a la CPU.

Patrocinado

Mientras que los grandes modelos de lenguaje suelen funcionar en aceleradores especializados como GPUs o TPUs, el CPU soporta las operaciones indispensables para que un agente pueda interactuar con el entorno y gestionar su funcionamiento.

Bhumik Patel detalla que las actividades de un agente suelen ser orquestar procesos, comunicarse con API y gestionar la memoria, funciones para las que los CPUs fueron diseñados precisamente, pues se trata de trabajo concurrente y distribuido. Además, recalca que aunque existen modelos muy pequeños —como resumidores, clasificadores o evaluadores específicos— que pueden ejecutarse directamente en CPUs, estas ya manejan con eficacia modelos con hasta 8.000 millones de parámetros y esperan ampliar su rango próximamente.

La necesidad de entornos seguros y aislados: sandboxes para agentes

Para que estos agentes puedan ejecutar código de manera segura, es imprescindible contar con entornos aislados que eviten que cualquier fallo o código malicioso afecte a sistemas productivos. Bhumik Patel señala que dado que los agentes actúan en representación del usuario, su código no siempre es fiable, por lo que se precisa una capa de aislamiento robusta.

Google ofrece en este sentido gVisor, un proyecto de código abierto que presenta una capa intermedia entre la aplicación y el sistema operativo anfitrión. Esta tecnología se integra en GKE Agent Sandbox, el entorno gestionado por Google para ejecutar agentes a gran escala, permitiendo ejecutar código sin la necesidad de confiar plenamente en el agente, sino confinándolo en un sandbox seguro.

Mo Farhat afirma que la capacidad de escalado de GKE Agent Sandbox es notable, pudiendo lanzar hasta 300 sandboxes por segundo en cada cluster, con un tiempo inferior a un segundo para comenzar la ejecución. Además, como los agentes suelen tener cargas irregulares debido a la interacción con agentes subordinados y periodos de espera, la plataforma utiliza técnicas como instantáneas de pods y agrupaciones «calientes» para mantener los recursos a bajo coste mientras están inactivos.

Eficiencia y rendimiento: la ventaja competitiva del CPU basado en Arm

En el evento Google Cloud Next, la compañía anunció que sus clientes que utilizan procesadores Axion basados en Arm en GKE Agent Sandbox pueden obtener un rendimiento por coste un 30% mejor que el de otros proveedores líderes en la nube. Esta ventaja se debe a la eficiencia energética y a la potencia de los núcleos de última generación desarrollados por Arm.

Google ofrece dos tipos de máquinas Axion: las N4A, optimizadas para costes y eficiencia, ideales para los sandboxes, y las C4A, orientadas a ofrecer un alto rendimiento en tareas monohilo, adecuadas para la orquestación y el control de flujo en los flujos de trabajo de agentes.

Patel añade que, para muchos desarrolladores en entornos cloud nativos, estas herramientas son familiares y su uso se extiende de forma natural a la gestión de agentes autónomos, facilitando la adopción de este nuevo paradigma.

Así, aunque las CPUs hayan sido desplazadas por sus equivalentes gráficos en la narrativa tecnológica, la evolución de la inteligencia artificial hacia agentes más autónomos y dinámicos está devolviendo a estas unidades de procesamiento una relevancia estratégica que impacta el futuro del desarrollo y la ejecución en la nube.

Add a Comment

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Patrocinado