La nueva era de la IA: MiniMax desafía a los gigantes
Las empresas chinas siguen desarrollando modelos de inteligencia artificial (IA) que compiten con las capacidades de los sistemas creados por OpenAI y otras compañías de IA con sede en EE. UU.
Esta semana, MiniMax, una startup respaldada por Tencent y Alibaba, presentó tres nuevos modelos: MiniMax-Text-01, MiniMax-VL-01 y T2A-01-HD. El modelo MiniMax-Text-01 está diseñado exclusivamente para texto, mientras que MiniMax-VL-01 tiene la capacidad de entender tanto imágenes como texto. Por su parte, T2A-01-HD genera audio, en particular, voz.
MiniMax afirma que el modelo MiniMax-Text-01, que cuenta con un tamaño de 456 mil millones de parámetros, supera a modelos como el Gemini 2.0 Flash de Google en algunas pruebas, incluidas MATH y SimpleQA, que miden la habilidad de un modelo para resolver problemas de matemáticas y preguntas basadas en hechos. Generalmente, un mayor número de parámetros se traduce en una mejor capacidad de resolución de problemas.
Con respecto al MiniMax-VL-01, la empresa sostiene que compite con el Claude 3.5 Sonnet de Anthropic en evaluaciones que requieren comprensión multimodal. Por ejemplo, en pruebas como ChartQA, que desafían a los modelos a responder preguntas relacionadas con gráficos y diagramas, el MiniMax-VL-01 no supera al Gemini 2.0 Flash en muchas pruebas, aunque sí tiene un desempeño superior en algunas métricas al GPT-4o de OpenAI y al Llama 3.1 de Meta.
Un aspecto notable del MiniMax-Text-01 es su amplio contexto. El "contexto" o "ventana de contexto" de un modelo se refiere a la información que considera antes de generar una respuesta. Con una ventana de contexto de 4 millones de tokens, MiniMax-Text-01 puede analizar alrededor de 3 millones de palabras de una vez, lo que equivale a más de cinco copias de "Guerra y Paz".
Para poner esto en perspectiva, la ventana de contexto de MiniMax-Text-01 es aproximadamente 31 veces el tamaño de la de GPT-4o y Llama 3.1.
El último modelo que lanzó MiniMax esta semana, T2A-01-HD, es un generador de audio optimizado para la síntesis de voz. Este modelo puede crear una voz sintética con un ritmo, tono y timbre ajustables en aproximadamente 17 idiomas diferentes, incluidos inglés y chino, y también puede clonar una voz con solo 10 segundos de grabación.
MiniMax no divulgó resultados de pruebas que comparen el T2A-01-HD con otros modelos de generación de audio. Sin embargo, suena similar a los modelos de audio de Meta y de startups como PlayAI.
A excepción del T2A-01-HD, que solo está disponible a través de la API de MiniMax y la plataforma Hailuo AI, los nuevos modelos de MiniMax pueden ser descargados desde GitHub y la plataforma de desarrollo de IA Hugging Face.
A pesar de que los modelos están disponibles "abiertamente", no son completamente de código abierto. MiniMax-Text-01 y MiniMax-VL-01 no son completamente reutilizables, ya que MiniMax no ha publicado los componentes necesarios, como los datos de entrenamiento, para recrearlos desde cero. Además, están bajo una licencia restrictiva que prohíbe a los desarrolladores usarlos para mejorar modelos de IA rivales y requiere que las plataformas con más de 100 millones de usuarios activos mensuales soliciten una licencia especial de MiniMax.
MiniMax fue fundada en 2021 por ex-empleados de SenseTime, una de las mayores empresas de IA en China. Entre sus proyectos se incluyen aplicaciones como Talkie, una plataforma de rol impulsada por IA similar a Character AI, y modelos de texto a video que MiniMax ha lanzado en Hailuo.
Algunos de los productos de MiniMax han suscitado controversia. Talkie fue retirado de la App Store de Apple en diciembre por razones “técnicas” no especificadas y presenta avatares de figuras públicas que no han dado su consentimiento para ser representadas en la aplicación.
En diciembre, la revista Broadcast informó que los generadores de video de MiniMax pueden reproducir los logotipos de canales de televisión británicos, sugiriendo que sus modelos fueron entrenados con contenido de esos canales. Además, se ha informado que MiniMax está siendo demandada por iQiyi, un servicio de streaming chino, que alega que MiniMax entrenó ilícitamente sus modelos con grabaciones protegidas por derechos de autor de iQiyi.
La aparición de los nuevos modelos de MiniMax se da pocos días después de que la administración saliente de Biden propusiera reglas de exportación más estrictas y restricciones sobre las tecnologías de IA para las empresas chinas. Las compañías en China ya estaban impedidas de adquirir chips avanzados de IA, pero si las nuevas reglas se implementan tal como están escritas, enfrentarán límites más estrictos tanto en la tecnología de semiconductores como en los modelos necesarios para desarrollar sistemas de IA sofisticados.
El miércoles, la administración Biden anunció medidas adicionales para mantener los chips avanzados fuera de China. Las fábricas de chips y las empresas de empaquetado que deseen exportar ciertos chips estarán sujetas a requisitos de licencia más amplios a menos que ejerzan una mayor supervisión para evitar que sus productos lleguen a clientes chinos.
IA, China, MiniMax, tecnología