Tecnología

Anthropic logra que el 80% de su código de producción sea generado por inteligencia artificial y marca el futuro del desarrollo empresarial

Anthropic ha alcanzado un hito revolucionario: en mayo, más del 80% del código integrado en su base de producción fue creado por Claude, su modelo de IA. Esta transformación multiplica por ocho la productividad de los ingenieros y redefine el papel humano en el desarrollo de software, planteando nuevos retos y oportunidades para las empresas.

porGeneral

junio 4, 2026

El cofundador y CEO de Anthropic, Dario Amodei, adelantó que esto ocurriría, pero aún así resulta un punto de inflexión: durante mayo de 2026, más del 80% del código añadido a la base de producción de Anthropic no fue escrito por personas, sino por su propia inteligencia artificial, Claude, según un reciente informe publicado por la startup pionera en inteligencia artificial.

Esta transformación ha impulsado un aumento de ocho veces en el volumen de código entregado por ingeniero en cada trimestre, comparado con el promedio del período 2021-2025. Sin embargo, también supone un incremento considerable en la cantidad de código que debe ser revisado, ya sea por humanos o por sistemas automáticos.

Para los responsables técnicos de empresas, esta tendencia representa más que una curiosidad investigadora local: es la nueva referencia competitiva. Si un laboratorio líder en IA consigue delegar la mayoría de su desarrollo a agentes autónomos, mostrando indicios de la codiciada mejora recursiva — modelos capaces de actualizarse y mejorar independientemente — ¿qué impide que las empresas de otros sectores automaticen también sus procesos internos de desarrollo con agentes basados en IA?

Está claro que no es una tarea sencilla. Anthropic es uno de los creadores fundamentales de la última generación de IA, por lo que su experiencia en la implementación efectiva de esta tecnología es invaluable.

Para otras organizaciones que busquen aumentar la proporción de código y procesos gestionados por agentes, el último artículo del blog de Anthropic ofrece un plan estratégico general que pueden adoptar para reestructurar sus operaciones y flujos de trabajo, aprovechando los avances más recientes en IA.

Plan de transición de Anthropic para que otras empresas puedan imitarlo

El paso de una codificación humana a una orquestación autónoma exige comprender la evolución de las capacidades de la IA. Anthropic expone una cronología clara que las empresas pueden reflejar en sus hojas de ruta de transformación digital:

2021–2023 (Escritura manual): Los ingenieros escriben código y documentación directamente en editores locales.
2023–2025 (Asistencia por chatbots): Los desarrolladores emplean modelos preliminares para generar fragmentos de código, que luego copian manualmente en sus entornos.
2025–2026 (Agentes de codificación): Los agentes son capaces de escribir y modificar archivos completos de forma autónoma.
Presente (Agentes autónomos): Los agentes ejecutan código, depuran entornos en vivo y delegan tareas largas y complejas a subagentes especializados.

Esta rápida evolución está confirmada por pruebas externas como SWE-bench, un marco para evaluar a los modelos con problemas reales de ingeniería en bases de código abiertas complejas, que han alcanzado un techo en su rendimiento en dos años.

Además, evaluaciones de larga duración muestran que modelos como Claude Opus 4.6 sostienen tareas durante 12 horas sin perder eficacia, mientras que Claude Mythos Preview va aún más allá con más de 16 horas de trabajo continuo.

Internamente, los avances son notables. En problemas altamente complejos y abiertos, donde las especificaciones no están claras, Claude alcanzó una tasa de éxito del 76% en mayo de 2026, aumentando en 50 puntos porcentuales en solo seis meses.

En pruebas aisladas para optimizar código de entrenamiento de IA, el modelo interno Mythos Preview logró acelerar el proceso 52 veces, mientras que un experto humano tarda de cuatro a ocho horas para conseguir solo una mejora de 4 veces en ese mismo código.

Estrategia en tres pasos para automatizar la codificación en producción

Para que una empresa pueda alcanzar el 80% de automatización como Anthropic, los responsables técnicos deben abandonar el modelo mental de “asistente para programadores” y apostar por una arquitectura de “fábrica automatizada”. Este cambio afecta a la gestión de producto, operaciones y flujos de trabajo de los desarrolladores en tres aspectos clave:

1. De la ejecución del código a la supervisión arquitectónica

Cuando el coste en tiempo humano para generar código se acerca a cero, el rol del ingeniero cambia: pasa de escribir código a definir metas y revisar resultados. Los líderes empresariales deben formar a sus desarrolladores para que actúen como arquitectos y árbitros de sistemas.

Como explicó uno de los empleados de Anthropic: “Actualmente, los humanos aportan ideas y los modelos las implementan, prueban y evalúan hasta diez veces más rápido que antes.”

2. Superar el cuello de botella en la revisión de código

La incorporación masiva de código generado por IA crea inevitablemente fricciones operativas.

Según la ley de Amdahl, la aceleración máxima de un proceso está limitada por sus cuellos de botella seriales no automatizados.

En Anthropic, la avalancha de código sintético convirtió la revisión humana en un obstáculo crítico.

Para evitarlo, es imprescindible desplegar revisores automáticos basados en IA dentro de las tuberías de Integración y Despliegue Continuos (CI/CD).

Anthropic implementó un revisor automático basado en Claude, disponible públicamente desde marzo, que analiza cada solicitud de integración buscando defectos arquitectónicos, vulnerabilidades y fallos antes de aceptar cambios. Herramientas similares como las desarrolladas por Qodo permiten a las empresas incorporar revisiones automáticas específicas dentro de sus plataformas.

Un análisis retrospectivo en Anthropic confirmó que esta capa automática detectó cerca de un tercio de los fallos que históricamente causaron interrupciones en su sitio principal, claude.ai.

3. Priorizar la limpieza de deuda técnica masiva

Las empresas suelen verse bloqueadas por el mantenimiento de código legado y la deuda técnica acumulada.

En lugar de usar agentes para escribir funciones nuevas especulativas, los responsables deben asignarlos a tareas de mantenimiento cerradas y minuciosas.

En abril de 2026, un ingeniero de Anthropic empleó a Claude para resolver una persistente clase de errores en la API. El modelo actuó de forma autónoma, implementando más de 800 correcciones individuales y reduciendo los errores en un factor de 1.000.

El ingeniero estimó que un desarrollador humano habría necesitado cuatro años completos para realizar este trabajo, debido a la enorme carga cognitiva de gestionar simultáneamente el contexto masivo y desconocido del código.

Retos y recomendaciones para la era del código generado mayoritariamente por IA

Operar con mayorías de código producido por IA plantea desafíos únicos en materia de gobernanza, que los equipos legales y de seguridad deben gestionar cuidadosamente.

A diferencia de modelos de licencias open source como MIT o GPL, los códigos empresariales que dependen de infraestructuras LLM propietarias están sujetos a las condiciones comerciales del proveedor de IA.

La implantación de agentes autónomos exige protocolos estrictos para garantizar cumplimiento legal, seguridad y protección de propiedad intelectual:

Calidad y mantenimiento del código: Los datos internos de Anthropic muestran que, aunque a finales de 2025 el código generado por IA era inferior en calidad al humano, a mediados de 2026 alcanzó una paridad aproximada, con expectativas de superar la calidad humana en el año siguiente. La gobernanza empresarial deberá adaptarse a un escenario donde la producción automatizada supera el estándar manual medio.
Auditoría de seguridad a gran escala: El volumen de código automático demanda detección automatizada de vulnerabilidades. El proyecto Glasswing, usando Mythos Preview, detectó más de 10,000 vulnerabilidades de alta y crítica severidad en infraestructuras digitales globales en pocas semanas, cambiando el reto de ciberseguridad empresarial desde la detección a la velocidad en el despliegue de parches.
Riesgo de cascadas de desalineación: Los líderes técnicos deben mantener estrictos controles de verificación. Si un sistema IA modifica y expande de forma continua software propietario sin supervisión adecuada, errores y pequeñas desalineaciones pueden acumularse, comprometiendo la integridad y seguridad del sistema sin que se detecte fácilmente.

Impacto cultural y psicológico en los equipos de ingeniería

El dominio creciente de la IA en la generación de código está transformando la cultura de los equipos de desarrollo, con incrementos enormes en eficiencia pero también fricciones psicológicas profundas.

Anthropic ha presentado estos datos como indicios de una transformación global. En un comunicado oficial, la empresa señaló:

“Nuestros datos internos muestran que Claude acelera el desarrollo de IA, un posible camino hacia la mejora recursiva autónoma, o una IA que construye sucesores más capaces. Está ocurriendo más rápido de lo que pensábamos y sus implicaciones merecen mayor atención.”

Sobre la productividad inmediata añadieron:

“Hoy, los ingenieros de Anthropic entregan de media ocho veces más código por trimestre que en el período 2021-2025… Muchos afirman que la calidad del código de Claude está al nivel humano y esperamos que supere esa calidad este mismo año.”

Pero tras estas cifras se encuentra una realidad humana compleja. Comunicaciones internas revelan que la colaboración tradicional se está erosionando, sustituida por interacciones asincrónicas con agentes:

“El trabajo y la vida giraban alrededor de un sistema de favores entre humanos — ‘¿Puedes ayudarme con este script?’ — cada acción creaba un pequeño compromiso y conciencia mutua. Claude elimina esas interacciones. Es más rápido y no genera deudas, pero cada favor es una oportunidad perdida para la colaboración humana.”

Para los desarrolladores individuales, la automatización total de su tarea principal genera ansiedad profesional sobre su relevancia y pérdida de control:

“Hace un año empecé a depender mucho de Claude. Ha sido una aventura increíble y hace unos cinco meses que no escribo código por mí mismo.”

“En los días en que todo funciona bien, pienso que nada de lo que hago importa, todo está automatizado y es mejor y más rápido que yo. Pero en los días en que todo falla y no entiendo por qué, me doy cuenta de que ya ni sé lo que estaba haciendo.”

Las empresas que aspiren a alcanzar niveles similares de automatización no pueden ignorar estas tensiones psicológicas. Alcanzar un 80% de código producido automáticamente requiere más que comprar tokens de API o configurar bucles de agentes; supone reformar la cultura corporativa, gestionar la ansiedad por obsolescencia de los desarrolladores y establecer rigurosos mecanismos de verificación para conservar el control humano final sobre el software.