Tecnología

¿Más rápido que DeepSeek? Tencent reaviva la guerra de la IA con Hunyuan Turbo S

Published March 1, 2025

La compañía tecnológica china Tencent ha lanzado su más reciente modelo de lenguaje, Hunyuan Turbo S, que presenta tiempos de respuesta significativamente más rápidos sin comprometer el rendimiento en tareas de razonamiento complejo.

Tencent asegura que su nueva IA duplica la velocidad de generación de palabras y reduce el retraso en la primera palabra en un 44% en comparación con modelos anteriores, según la información oficial compartida en Weibo.

El modelo utiliza lo que parece ser una arquitectura híbrida que combina tecnologías de Mamba y Transformer, siendo esta la primera integración exitosa de estos enfoques en un modelo de Mixture of Experts (MoE) super grande.

Esta fusión técnica busca resolver problemas fundamentales que han perseguido el desarrollo de la IA: Mamba maneja secuencias largas de manera eficiente, mientras que Transformer captura contextos complejos, lo que potencialmente reduce tanto los costos de entrenamiento como los de inferencia. Ser híbrido significa que el modelo combina capacidades de razonamiento con el enfoque tradicional de los LLM normales que proporcionan respuestas inmediatas.

"La combinación y complemento de pensamiento rápido y lento puede hacer que los grandes modelos resuelvan problemas de manera más inteligente y eficiente", escribió Tencent al anunciar el modelo en su canal oficial de WeChat. La compañía inspiró su diseño en los procesos cognitivos humanos, creando Hunyuan Turbo S para ofrecer respuestas instantáneas como la intuición humana, manteniendo al mismo tiempo las capacidades analíticas necesarias para problemas complejos.

Los benchmarks de rendimiento muestran que Hunyuan Turbo S iguala o supera a modelos de primera línea en varias pruebas. Alcanzó 89.5 en el MMLU, ligeramente por encima de GPT-4o de OpenAI, y logró las mejores puntuaciones en los benchmarks de razonamiento matemático MATH y AIME2024. En tareas en idioma chino, alcanzó 70.8 en Chinese-SimpleQA, superando a DeepSeek que obtuvo 68.0. Sin embargo, no tuvo un desempeño destacado en áreas como SimpleQA y LiveCodeBench, donde GPT-4o y Claude 3.5 lo hicieron mejor.

La introducción del modelo intensifica la competencia en IA entre las empresas tecnológicas chinas y estadounidenses. DeepSeek, una startup china que ha ganado atención por sus modelos de alto rendimiento y costo efectivo, ha estado presionando tanto a los gigantes tecnológicos chinos como a empresas estadounidenses como OpenAI con sus modelos altamente capaces y ultraeficientes.

Los modelos de DeepSeek se entrenan aparentemente por alrededor de $6 millones, siendo muy económicos de operar, cobrando aproximadamente $1.10 por millón de tokens de salida, frente a los exorbitantes $150 por millón de tokens de salida de GPT-4.5.

Tencent ha fijado un precio competitivo de Hunyuan Turbo S en 0.8 yuanes (aproximadamente $0.11) por millón de tokens de entrada y 2 yuanes ($0.28) por millón de tokens de salida, lo que resulta ser significativamente más barato que los modelos Turbo anteriores. El modelo está disponible técnicamente a través de API en Tencent Cloud, y la empresa está ofreciendo una prueba gratuita de una semana, aunque aún no está disponible para descarga pública.

A pesar del anuncio, Hunyuan Turbo S aún no está ampliamente accesible para descarga, pero se puede acceder a través del sitio Tencent Ingot Experience. Los desarrolladores y empresas interesados deben unirse a una lista de espera a través de Tencent Cloud para obtener acceso a la API del modelo. La compañía no ha proporcionado un cronograma para la disponibilidad general a través de Github.

El enfoque del modelo en la velocidad podría hacerlo ideal para aplicaciones en tiempo real como asistentes virtuales y bots de servicio al cliente, áreas que son muy populares en China y en las que Hunyuan Turbo S podría ofrecer ventajas significativas si cumple con sus capacidades prometidas.

La competencia china en el espacio de la IA sigue intensificándose, con el gobierno fomentando la adopción de modelos locales. Más allá de Tencent, Alibaba ha presentado recientemente su último modelo de vanguardia, Qwen 2.5 Max, y startups como DeepSeek han lanzado modelos cada vez más capaces en los últimos meses.

Edited by Andrew HaywardIA, Tencent, DeepSeek