Tecnología

Por qué las nuevas herramientas de agentes de OpenAI podrían cambiar la forma en que codificas

Published March 12, 2025

Si has sido desarrollador en producción durante un tiempo, sabes que las interfaces de programación de aplicaciones (APIs) están sujetas a cambios a capricho del proveedor.

Puedes dormir una noche sabiendo que tu aplicación está sólida y tiene un futuro brillante. Pero al despertar te das cuenta de que uno de tus proveedores de API ha anunciado un cambio que requiere que dediques los próximos seis meses a reescribir tu aplicación para que funcione con la API revisada. Pregúntame cómo lo sé.

También: La mejor IA para codificar en 2025 (y lo que no debes usar)

Las aplicaciones basadas en IA no son inmunes a esta inmutable ley de la vida de las APIs. OpenAI ha anunciado la introducción de la Responses API, que marcará la retirada de su Assistants API en algún momento de 2026.

Como suele suceder con la mayoría de los cambios de API, la nueva API hace más, funciona mejor y tiene menos costos adicionales. Sin embargo, a pesar de estas capacidades, la nueva API suma grandes tareas pendientes para aquellos que adoptaron las APIs anteriores.

OpenAI ha presentado una serie de nuevas características a nivel de programador para la creación de agentes de IA, incluida la API. Antes de profundizar en lo que hay de nuevo, pongamos este cambio en contexto.

Probablemente hayas notado que desde que la IA generativa (Gen AI) irrumpió en la escena hace unos años, casi todos los productos y servicios han agregado repentinamente una característica adicional de IA a su oferta base. Es una gran extensión para muchos productos y servicios, pero no es como si cada proveedor tuviera equipos de investigación en IA desarrollando grandes modelos de lenguaje.

En su lugar, estas empresas han licenciado APIs que proporcionan servicios de IA a un costo bastante predecible por transacción. Los modelos diferentes tienen distintos costos, pero a modo de estimación, un desarrollador podría hacer 67 consultas típicas de GPT-4.5, 1,176 consultas de GPT-4o o 20,000 consultas de mini GPT-4o por un solo dólar.

También: Cómo usar ChatGPT para escribir código - y mi truco favorito para depurar lo que genera

Con las APIs de OpenAI (y de otras compañías de IA), la funcionalidad de IA se puede agregar a tu código con llamadas de función simples y una tarjeta de crédito, ahorrando años de desarrollo y millones de dólares en infraestructura e investigación.

La nueva Responses API

Hasta ahora, OpenAI ofrecía una API llamada Chat Completions API, para enviar consultas de chat a ChatGPT y recibir respuestas. OpenAI también ofrecía una API llamada Assistants API, que habilitaba a los agentes a realizar razonamientos de múltiples pasos y acceder a archivos.

La nueva Responses API combina las características de ambas APIs anteriores. Se espera que la Chat Completions API permanezca, pero la compañía ha anunciado planes para retirar la Assistants API tan pronto como el próximo año en favor de la más capaz Responses API.

También: Cómo convertir a ChatGPT en tu herramienta de codificación de IA - y duplicar tu producción

Las tarifas para usar la Responses API se pueden encontrar en la página de precios de OpenAI y varían según el modelo y el uso.

La Responses API tiene tres herramientas integradas que los programadores pueden invocar: búsqueda web, búsqueda de archivos y uso de computadora.

La herramienta de búsqueda web

Si alguna vez has utilizado ChatGPT para buscar en la web y agregar una respuesta, ya sabes lo que hace la herramienta de búsqueda web. En el caso de la Responses API, permite a los programadores iniciar tales consultas desde sus programas.

Cuando se utiliza, la API proporciona texto como respuesta y enlaces a las fuentes junto con citas en línea. Muchas de estas respuestas deberían ser correctas. La compañía cita un gráfico que muestra que las pruebas de búsquedas web con GPT-4o solo fueron correctas en un 38% de los casos (tenlo en cuenta la próxima vez que uses ChatGPT para buscar), pero las búsquedas utilizando la vista previa de búsqueda de GPT-4o y la vista previa de búsqueda de mini GPT-4o fueron correctas en nueve de cada diez casos.

¿Mayormente correcto es bastante bueno, verdad?

La herramienta de búsqueda de archivos

La siguiente herramienta es la búsqueda de archivos, que buscará en una biblioteca de tus documentos corporativos. Y sí, sé lo que estás pensando. OpenAI dice que no entrena a sus IA con datos comerciales. Por lo tanto, deberías estar bastante seguro de que cargar todos tus datos estará seguro y no aparecerá en la respuesta de otro prompt.

También: Cómo pruebo la capacidad de codificación de un chatbot de IA - y tú también puedes

Sin embargo, hay problemas. Por un lado, a $0.10 por gigabyte, por mes, el almacenamiento de archivos no es barato. La base de datos de documentos corporativos de mi pequeña empresa es de 57TB. Si esa base de datos se subiera a OpenAI para una búsqueda de IA específica al contexto, el almacenamiento costaría casi $6,000 al mes, y mi empresa solo tiene dos empleados.

Los beneficios de tener una herramienta de búsqueda de IA es la capacidad de romper silos. Pero si los silos son lo que hace que el almacenamiento de datos sea más asequible al cargar solo datos selectos, esta estructura de precios podría limitar la utilidad de esta característica.

Herramienta de uso de computadora

Finalmente, OpenAI incluye su herramienta de uso de computadora, la herramienta de visualización y clic de pantalla que está en el corazón de su oferta de operador de agente.

Se supone que esto puede leer pantallas y, según el contenido de la pantalla, realizar procesamiento o hacer clic para causar acciones. Según las demostraciones, especialmente en la vista previa del anuncio actual, parece que la herramienta tiene un largo camino por recorrer antes de que sea universalmente útil.

Estén atentos a esta característica.

Agents SDK

Una API es un conjunto de puntos finales o llamadas de función para interactuar con un sistema externo. Un SDK (kit de desarrollo de software) es una colección más amplia, que a menudo incluye herramientas de software, algunas APIs, bibliotecas y utilidades, que trabajan juntas.

OpenAI anunció el Agents SDK, un conjunto de herramientas para construir, depurar y monitorear agentes en acción. El kit incluye la Responses API y agrega orquestación de flujo de trabajo, permitiendo a los programadores realizar razonamientos de múltiples pasos y ejecución de tareas.

También: Este nuevo benchmark de IA mide cuánto mienten los modelos

El kit también permite a los programadores crear equipos de agentes, cada uno con responsabilidades específicas. Una funcionalidad de "transferencia" permite que un agente haga algún trabajo, luego transfiera el procesamiento a otro agente, y así sucesivamente.

Además, y creo que esta es una de las características más importantes, un panel de monitoreo permite a los desarrolladores ver cada interacción con la IA, identificar qué agentes se usaron para qué y cómo fueron asignados. Con la prevalencia de las alucinaciones de IA, es importante poder llevar un registro de lo que están haciendo todas esas tareas independientes.

¿Qué opinas sobre las últimas actualizaciones de OpenAI?

¿Planeas integrar la Responses API en tus proyectos, o te preocupa la retirada de OpenAI de la Assistants API?

¿Qué opinas sobre las herramientas integradas, como la búsqueda web, búsqueda de archivos y uso de computadora? ¿Resuelven problemas reales o introducen nuevos desafíos?

¿Y qué hay del Agents SDK? ¿Lo ves como un cambio de juego para el desarrollo de agentes de IA, o hay algunas características que aún faltan? Déjanos saber en los comentarios a continuación.

Puedes seguir mis actualizaciones de proyectos diarios en las redes sociales. Asegúrate de suscribirte a mi boletín de actualización semanal, y seguirme en Twitter en x.com, en Facebook en facebook.com, y en YouTube en youtube.com.

IA, desarrollo, API