Dos conciencias: Mejoras en los Structured Outputs de la API de Gemini: Precisión y eficiencia en los datos generados por IA

Ilustracion-artistica-y-colorida-que-representa-un-ecosistema-de-IA-artificial-colaborativa-con-agentes-abstractos-intercambiando-datos-en-un-entorno-futurista-digital

Google ha anunciado una serie de mejoras significativas en los Structured Outputs de su API de Gemini, dirigidas a los desarrolladores que trabajan con sistemas de inteligencia artificial que requieren respuestas precisas y estructuradas. Estos avances impactan directamente en tareas como la extracción de datos, la automatización de flujos de trabajo y la comunicación entre agentes autónomos, donde la coherencia en el formato de salida es crucial.

El primer gran cambio es la compatibilidad ampliada con JSON Schema, una especificación ampliamente utilizada para validar estructuras de datos en formato JSON. Ahora, todos los modelos de Gemini activos incluyen soporte para JSON Schema, lo que facilita su integración con bibliotecas populares como Pydantic en Python o Zod en JavaScript/TypeScript. Esta compatibilidad no solo simplifica el trabajo del desarrollador, sino que permite que la salida del modelo sea fácilmente consumida por otras aplicaciones sin necesidad de conversiones adicionales.

Esta mejora complementa el soporte existente de la API para su objeto Schema basado en OpenAPI 3.0, y permite aprovechar nuevas capacidades como:

anyOf, que permite definir estructuras condicionales.
$ref, esencial para manejar esquemas recursivos.
minimum y maximum, para restricciones numéricas.
additionalProperties y type: 'null', para mayor flexibilidad en los datos.
prefixItems, que permite representar arreglos con elementos de distintos tipos, como si fueran tuplas.

Orden implícito de propiedades

Un detalle técnico pero fundamental es la introducción del respeto por el orden de las propiedades en la salida generada por el modelo. A partir de los modelos Gemini 2.5, la API garantiza que los campos del JSON devuelto seguirán el mismo orden en que fueron definidos en el esquema original. Esta característica, que también está disponible en la API compatible con OpenAI, elimina una de las molestias frecuentes para quienes necesitan trabajar con datos en formatos exactos para procesamiento posterior.

Por ejemplo, en un sistema de moderación de contenido, el uso de clases Pydantic para definir los posibles resultados y su estructura asegura que la IA devuelva datos que no solo cumplen con las reglas, sino que lo hacen en un orden predecible, lo cual es vital para sistemas que consumen directamente esa información.

Aplicaciones prácticas en entornos reales

Los Structured Outputs no son una curiosidad técnica. Son una herramienta cada vez más esencial en la construcción de aplicaciones reales con IA. Un ejemplo es Agentic Users, una plataforma centrada en agentes autónomos que interactúan en la web. Su equipo ha experimentado una reducción de hasta seis veces en llamadas a la API gracias al uso de esquemas precisos. Antes, era común tener que realizar validaciones adicionales o manejar respuestas rotas en JSON. Con esta nueva capacidad, las respuestas son confiables desde el primer intento.

En palabras de Luis Vega, fundador de Agentic Users, poder definir con claridad la estructura de las respuestas permite que los agentes trabajen de forma colaborativa sin requerir capas de traducción entre ellos. Es como si todos hablaran el mismo lenguaje, con la misma gramática y sin ambigüedades.

Otro ejemplo es Alkimi AI, una compañía que crea asistentes de IA para empresas y organizaciones educativas. Usando JSON Schema, pueden configurar sus asistentes automáticamente en varios pasos, asegurándose de que cada fase reciba y entregue los datos en el formato esperado. Esto les permite optimizar costos, ya que pueden emplear modelos más económicos sin comprometer la calidad del procesamiento, gracias a que el formato de respuesta está garantizado desde el inicio.

Dillon Uzar, CEO de Alkimi AI, resalta tres pilares que han mejorado con estas mejoras: fiabilidad, velocidad y eficiencia de costos. Obligar al modelo a responder en un formato legible por máquinas no solo reduce errores, sino que acelera el desarrollo de nuevas funciones, algo clave para mantenerse competitivo.

Una base sólida para el futuro de los agentes de IA

El concepto de agentes que se comunican entre sí como si fueran piezas de una misma orquesta es una tendencia clara en el desarrollo de IA actual. Y para que esa orquesta suene bien, cada músico (o agente) necesita su partitura bien definida. Los Structured Outputs ofrecen precisamente eso: una partitura estructurada, precisa y sin ambigüedades que permite que todos los componentes de un sistema colaborativo funcionen en armonía.

Ya no se trata solo de que una IA entienda el lenguaje humano, sino de que se comunique con otras IAs con total claridad. Y para ello, tener salidas que cumplan estrictamente con un esquema definido es tan importante como tener buenas respuestas. Con estas mejoras, la API de Gemini da un paso firme en esa dirección, al ofrecer herramientas más robustas y predecibles para construir sistemas inteligentes más confiables y eficientes.

La noticia Mejoras en los Structured Outputs de la API de Gemini: Precisión y eficiencia en los datos generados por IA fue publicada originalmente en Wwwhatsnew.com por Natalia Polo.

https://ift.tt/pxvsj1K
by Natalia Polo via WWWhat's new

Flash News

Archivo

Dos conciencias

Mejoras en los Structured Outputs de la API de Gemini: Precisión y eficiencia en los datos generados por IA

Orden implícito de propiedades

Aplicaciones prácticas en entornos reales

Una base sólida para el futuro de los agentes de IA

0 desahogos:

Publicar un comentario

Flash News

Archivo

Dos conciencias

Pages

Anything

Orden implícito de propiedades

Aplicaciones prácticas en entornos reales

Una base sólida para el futuro de los agentes de IA

Related

0 desahogos:

Publicar un comentario

document.write('footerblock1');

document.write('Crudos Esteban Rodriguez');

document.write('footerblock3');

document.write('footerblock4');