
OpenAI ha presentado GPT-5.1-Codex-Max, un modelo que redefine el papel de la inteligencia artificial en la programación. Esta versión sustituye al anterior GPT-5.1-Codex como modelo por defecto en los entornos Codex de OpenAI, convirtiéndose en una pieza clave en la automatización de tareas complejas en desarrollo de software. No se trata solo de una mejora incremental: este modelo está diseñado para operar como un asistente persistente capaz de manejar proyectos completos durante sesiones prolongadas, con capacidad para razonar de forma estructurada y mantener el contexto a gran escala.
Comparativas de rendimiento: una mejora sostenida
En pruebas de referencia ampliamente aceptadas en la industria, GPT-5.1-Codex-Max ha demostrado ventajas significativas frente a sus predecesores y competidores directos. En el benchmark SWE-Bench Verified, por ejemplo, alcanzó un 77,9% de precisión en escenarios de razonamiento de alta complejidad, superando tanto a GPT-5.1-Codex como al reciente Gemini 3 Pro de Google.
En Terminal-Bench 2.0, también lideró con un 58,1% de aciertos, por encima del 54,2% de Gemini. Y en LiveCodeBench Pro, un entorno competitivo con puntuación tipo Elo, igualó a su competidor con 2.439 puntos. Esto confirma su capacidad no solo para generar código correcto, sino también para hacerlo en condiciones exigentes que simulan entornos reales.
Arquitectura técnica: compresión contextual y eficiencia de tokens
Uno de los avances clave en GPT-5.1-Codex-Max es el uso de una técnica denominada «compaction». Este mecanismo permite al modelo retener información relevante y desechar lo redundante cuando se acerca al límite de su ventana de contexto. Es como si un programador pudiera recordar solo lo esencial de una conversación técnica larga sin perder detalle importante. Esta habilidad le permite trabajar de forma continua en tareas que pueden durar más de 24 horas, como refactorizaciones complejas, depuraciones automáticas o ciclos de desarrollo guiados por pruebas.
En cuanto al uso de recursos, el modelo logra hasta un 30% de reducción en el consumo de «tokens de pensamiento» en esfuerzos de razonamiento medio, comparado con su versión anterior. Esto no solo mejora el rendimiento, sino que tiene implicaciones directas en costes y velocidad de respuesta.
Aplicaciones y entornos disponibles
GPT-5.1-Codex-Max ya está operativo en varios entornos del ecosistema Codex, incluyendo:
- Codex CLI, la herramienta de línea de comandos oficial de OpenAI.
- Extensiones para entornos de desarrollo integrados (IDEs), presumiblemente desarrolladas por OpenAI.
- Espacios interactivos para simulaciones de código como CartPole o el explorador de la Ley de Snell.
- Herramientas internas de revisión de código utilizadas por los propios ingenieros de OpenAI.
Aunque aún no está disponible vía API pública, OpenAI ha indicado que esta opción llegará pronto. Por ahora, quienes deseen trabajar con el modelo pueden hacerlo mediante la instalación del CLI de Codex.
Capacidad interactiva en tiempo real
GPT-5.1-Codex-Max también se distingue por su capacidad de interacción en tiempo real con herramientas y simulaciones. En las demostraciones presentadas, se muestra cómo el modelo colabora en la simulación de algoritmos de aprendizaje por refuerzo y en la visualización de comportamientos ópticos complejos. Esta capacidad de interactuar, razonar y codificar al mismo tiempo en un entorno coherente marca una nueva etapa para los desarrolladores: una en la que la IA no solo responde, sino que también participa.
Seguridad y ciberseguridad bajo control
Aunque no alcanza la categoría de «Alta capacidad» en ciberseguridad según el marco de preparación de OpenAI, Codex-Max es el modelo más potente en este ámbito que la empresa ha desplegado hasta ahora. Se utiliza en detección y corrección de vulnerabilidades de forma automatizada, siempre bajo estrictas condiciones: sin acceso a redes y con aislamiento por defecto.
Para prevenir usos maliciosos, OpenAI ha implementado sistemas de vigilancia que incluyen rutas de actividad y mecanismos de interrupción ante comportamientos sospechosos. El modelo opera en espacios de trabajo locales a menos que el usuario decida ampliar el acceso, lo que ayuda a mitigar riesgos como inyecciones de prompts o manipulaciones desde código externo.
Impacto en el flujo de trabajo de los desarrolladores
El modelo está disponible para suscriptores de ChatGPT en sus planes Plus, Pro, Business, Edu y Enterprise. En los entornos Codex, pasará a ser la opción por defecto, reemplazando al modelo anterior. OpenAI indica que el 95% de sus ingenieros lo utiliza semanalmente, y que gracias a él han logrado aumentar en un 70% el número promedio de «pull requests» enviados.
Pese a su nivel de autonomía, Codex-Max no sustituye el juicio humano. El modelo genera registros de terminal, citas de pruebas y salidas de herramientas, promoviendo una programación más transparente y verificable. Su función principal es la de asistente técnico, acompañando al desarrollador, pero dejando la supervisión y decisión final en manos humanas.
Hacia una nueva etapa del desarrollo software asistido
GPT-5.1-Codex-Max refleja un cambio en la estrategia de OpenAI hacia herramientas de desarrollo agéntico, es decir, aquellas que pueden actuar por cuenta propia dentro de marcos de supervisión definidos. Su habilidad para gestionar contextos extensos, realizar tareas de gran escala y optimizar recursos lo posiciona como una herramienta preparada para operar no solo en archivos aislados, sino sobre repositorios enteros.
Esta evolución se inscribe en una tendencia más amplia de la industria hacia entornos de programación donde la IA no solo asiste, sino que colabora, anticipa y propone. A medida que las capacidades de modelos como Codex-Max se integren en más plataformas, su uso podría marcar un antes y un después en la forma en que concebimos el trabajo de programación.
https://ift.tt/OLPfmKl
by Natalia Polo via WWWhat's new












0 desahogos:
Publicar un comentario
Los comentarios son opiniones personales y no necesariamente coinciden ideológicamente con esta pagina. Tu cosmovisión es única e irrepetible.