OpenAI Lanza o3-mini, un Modelo de Razonamiento Enfocado en STEM
OpenAI ha lanzado o3-mini, un nuevo modelo de inteligencia artificial en su serie de razonamiento que se enfoca en las capacidades STEM, especialmente en programación, matemáticas y ciencias.
La empresa de inteligencia artificial anunció el nuevo modelo en una publicación de blog.
OpenAI o3-mini es nuestro primer modelo de razonamiento pequeño que soporta características muy solicitadas por los desarrolladores, incluyendo la llamada a funciones, salidas estructuradas y mensajes para desarrolladores, lo que lo hace listo para producción desde el principio. Al igual que OpenAI o1-mini y OpenAI o1-preview, o3-mini también soportará transmisión. Además, los desarrolladores podrán elegir entre tres opciones de esfuerzo de razonamiento: bajo, medio y alto, para optimizar según sus casos de uso específicos. Esta flexibilidad permite que o3-mini "piense más duro" al enfrentar desafíos complejos o priorice la velocidad cuando la latencia es una preocupación. Sin embargo, o3-mini no soporta capacidades visuales, por lo que los desarrolladores deben seguir utilizando OpenAI o1 para tareas de razonamiento visual. O3-mini se está lanzando en la API de Chat Completions, API de Asistentes y API por Lotes a partir de hoy para desarrolladores seleccionados en niveles de uso de API del 3 al 5.
OpenAI menciona que sus modelos o1 siguen siendo su modelo de razonamiento principal, pero o3-mini ofrece una experiencia especializada para quienes la necesitan.
En ChatGPT, o3-mini utiliza el esfuerzo de razonamiento medio para proporcionar un equilibrio entre velocidad y precisión. Todos los usuarios de pago también tendrán la opción de seleccionar o3-mini-alto en el selector de modelos para una versión de mayor inteligencia que toma un poco más de tiempo en generar respuestas. Los usuarios profesionales tendrán acceso ilimitado tanto a o3-mini como a o3-mini-alto.
Curiosamente, el modelo o3-mini supera a o1 en algunas situaciones, especialmente en el ámbito STEM.
Al igual que su predecesor OpenAI o1, OpenAI o3-mini ha sido optimizado para el razonamiento STEM. O3-mini con esfuerzo de razonamiento medio iguala el rendimiento de o1 en matemáticas, programación y ciencias, mientras que ofrece respuestas más rápidas. Evaluaciones realizadas por expertos mostraron que o3-mini produce respuestas más precisas y claras, con habilidades de razonamiento más fuertes, que OpenAI o1-mini. Los evaluadores prefirieron las respuestas de o3-mini a las de o1-mini el 56% de las veces y observaron una reducción del 39% en errores importantes en preguntas difíciles del mundo real. Con esfuerzo de razonamiento medio, o3-mini iguala el rendimiento de o1 en algunas de las evaluaciones de razonamiento e inteligencia más desafiantes, incluyendo AIME y GPQA.
OpenAI también resalta la velocidad y eficiencia del modelo o3-mini.
Con una inteligencia comparable a OpenAI o1, OpenAI o3-mini ofrece un rendimiento más rápido y una mayor eficiencia. Más allá de las evaluaciones STEM destacadas anteriormente, o3-mini demuestra resultados superiores en evaluaciones adicionales de matemáticas y factualidad con esfuerzo de razonamiento medio. En pruebas A/B, o3-mini proporcionó respuestas un 24% más rápidas que o1-mini, con un tiempo promedio de respuesta de 7.7 segundos en comparación con 10.16 segundos.
Los modelos o3-mini continúan los esfuerzos de OpenAI para ofrecer una variedad de modelos de IA, ajustados a tareas y usos específicos.
OpenAI, IA, STEM