Flash News

Archivo

"Para que la racionalidad del debate pueda existir, tal y como preconizaba la teoría liberal clÔsica, no basta la libertad formal de todos los ciudadanos para intervenir. Es preciso también que todos los participantes estén dotados de canales de información eficaces para conocer a fondo la realidad en torno a la que discuten. Requieren ademÔs una 'conciencia crítica' que les mantenga alerta y les impulse a aceptar el esfuerzo de analizar con rigor los problemas públicos. Unos ciudadanos despreocupados por la calidad de las informaciones de actualidad que reciben, ignorantes del grado de superficialidad y escasez de las explicaciones de la actualidad pública que llegan a recibir, es un público desposeído de capacidad real de participación" (José Luis Dader)

Mail Instagram Pinterest RSS
Mega Menu

Mejoras en los Structured Outputs de la API de Gemini: Precisión y eficiencia en los datos generados por IA

Ilustracion-artistica-y-colorida-que-representa-un-ecosistema-de-IA-artificial-colaborativa-con-agentes-abstractos-intercambiando-datos-en-un-entorno-futurista-digital

Google ha anunciado una serie de mejoras significativas en los Structured Outputs de su API de Gemini, dirigidas a los desarrolladores que trabajan con sistemas de inteligencia artificial que requieren respuestas precisas y estructuradas. Estos avances impactan directamente en tareas como la extracción de datos, la automatización de flujos de trabajo y la comunicación entre agentes autónomos, donde la coherencia en el formato de salida es crucial.

El primer gran cambio es la compatibilidad ampliada con JSON Schema, una especificación ampliamente utilizada para validar estructuras de datos en formato JSON. Ahora, todos los modelos de Gemini activos incluyen soporte para JSON Schema, lo que facilita su integración con bibliotecas populares como Pydantic en Python o Zod en JavaScript/TypeScript. Esta compatibilidad no solo simplifica el trabajo del desarrollador, sino que permite que la salida del modelo sea fÔcilmente consumida por otras aplicaciones sin necesidad de conversiones adicionales.

Esta mejora complementa el soporte existente de la API para su objeto Schema basado en OpenAPI 3.0, y permite aprovechar nuevas capacidades como:

  • anyOf, que permite definir estructuras condicionales.
  • $ref, esencial para manejar esquemas recursivos.
  • minimum y maximum, para restricciones numĆ©ricas.
  • additionalProperties y type: 'null', para mayor flexibilidad en los datos.
  • prefixItems, que permite representar arreglos con elementos de distintos tipos, como si fueran tuplas.

Orden implĆ­cito de propiedades

Un detalle técnico pero fundamental es la introducción del respeto por el orden de las propiedades en la salida generada por el modelo. A partir de los modelos Gemini 2.5, la API garantiza que los campos del JSON devuelto seguirÔn el mismo orden en que fueron definidos en el esquema original. Esta característica, que también estÔ disponible en la API compatible con OpenAI, elimina una de las molestias frecuentes para quienes necesitan trabajar con datos en formatos exactos para procesamiento posterior.

Por ejemplo, en un sistema de moderación de contenido, el uso de clases Pydantic para definir los posibles resultados y su estructura asegura que la IA devuelva datos que no solo cumplen con las reglas, sino que lo hacen en un orden predecible, lo cual es vital para sistemas que consumen directamente esa información.

Aplicaciones prƔcticas en entornos reales

Los Structured Outputs no son una curiosidad técnica. Son una herramienta cada vez mÔs esencial en la construcción de aplicaciones reales con IA. Un ejemplo es Agentic Users, una plataforma centrada en agentes autónomos que interactúan en la web. Su equipo ha experimentado una reducción de hasta seis veces en llamadas a la API gracias al uso de esquemas precisos. Antes, era común tener que realizar validaciones adicionales o manejar respuestas rotas en JSON. Con esta nueva capacidad, las respuestas son confiables desde el primer intento.

En palabras de Luis Vega, fundador de Agentic Users, poder definir con claridad la estructura de las respuestas permite que los agentes trabajen de forma colaborativa sin requerir capas de traducción entre ellos. Es como si todos hablaran el mismo lenguaje, con la misma gramÔtica y sin ambigüedades.

Otro ejemplo es Alkimi AI, una compañía que crea asistentes de IA para empresas y organizaciones educativas. Usando JSON Schema, pueden configurar sus asistentes automÔticamente en varios pasos, asegurÔndose de que cada fase reciba y entregue los datos en el formato esperado. Esto les permite optimizar costos, ya que pueden emplear modelos mÔs económicos sin comprometer la calidad del procesamiento, gracias a que el formato de respuesta estÔ garantizado desde el inicio.

Dillon Uzar, CEO de Alkimi AI, resalta tres pilares que han mejorado con estas mejoras: fiabilidad, velocidad y eficiencia de costos. Obligar al modelo a responder en un formato legible por mƔquinas no solo reduce errores, sino que acelera el desarrollo de nuevas funciones, algo clave para mantenerse competitivo.

Una base sólida para el futuro de los agentes de IA

El concepto de agentes que se comunican entre sí como si fueran piezas de una misma orquesta es una tendencia clara en el desarrollo de IA actual. Y para que esa orquesta suene bien, cada músico (o agente) necesita su partitura bien definida. Los Structured Outputs ofrecen precisamente eso: una partitura estructurada, precisa y sin ambigüedades que permite que todos los componentes de un sistema colaborativo funcionen en armonía.

Ya no se trata solo de que una IA entienda el lenguaje humano, sino de que se comunique con otras IAs con total claridad. Y para ello, tener salidas que cumplan estrictamente con un esquema definido es tan importante como tener buenas respuestas. Con estas mejoras, la API de Gemini da un paso firme en esa dirección, al ofrecer herramientas mÔs robustas y predecibles para construir sistemas inteligentes mÔs confiables y eficientes.



https://ift.tt/pxvsj1K
by Natalia Polo via WWWhat's new

0 desahogos:

Publicar un comentario

Los comentarios son opiniones personales y no necesariamente coinciden ideológicamente con esta pagina. Tu cosmovisión es única e irrepetible.