Tecnología

AI por el precio de un sándwich: los avances de Alibaba en EE.UU.

Published February 10, 2025

La competencia por crear modelos de inteligencia artificial (IA) de alto rendimiento y bajo costo está tomando fuerza. Recientemente, un equipo de científicos informáticos de EE.UU., incluidos la reconocida "madre de la IA" china-estadounidense Li Feifei, desarrolló un nuevo modelo de razonamiento que fue entrenado por menos de 50 dólares utilizando tecnología de código abierto del Grupo Alibaba.

El modelo de razonamiento S1 se construyó utilizando el modelo Qwen2.5-32b-Instruct de la gigantesca compañía de comercio electrónico china. Este esfuerzo fue realizado por investigadores de la Universidad de Stanford, donde trabaja Li, y de la Universidad de Washington, según un artículo de investigación publicado la semana pasada.

Las capacidades del modelo de Alibaba evidencian cómo China está acortando la brecha en IA con los principales actores de EE.UU., especialmente después del éxito de DeepSeek, que lanzó modelos de alto rendimiento a bajo costo y capturó la atención global. Las acciones de Alibaba, propietario del South China Morning Post, aumentaron un 6 por ciento el lunes.

El modelo S1, después de ser entrenado con las respuestas a 1,000 preguntas cuidadosamente seleccionadas y el "proceso de razonamiento" destilado del modelo experimental Gemini de Google, superó en habilidades matemáticas y de programación al modelo o1-preview de OpenAI, de acuerdo con el documento.

Bajo costo de entrenamiento de modelos de IA

Desarrollar el modelo S1 tuvo un costo tan bajo como 14 dólares solo en el uso de unidades de procesamiento gráfico (GPUs), según las cifras mencionadas en la investigación. Este modelo fue entrenado durante 26 minutos utilizando 16 Nvidia H100, cuyos alquileres son de aproximadamente 2 dólares por hora.

El secreto para entrenar un modelo de razonamiento potente a un costo tan bajo, comparable al precio de un sándwich en un deli de Nueva York, radica en la calidad del modelo base, explica Pan Jiayi, un científico informático de la Universidad de California, Berkeley. "La calidad del modelo base es la clave", afirma.

IA, Alibaba, Stanford