Modelos de código abierto y nueva financiación: las startups de IA en China responden a DeepSeek
El logotipo de DeepSeek fue visto durante la Conferencia Global de Desarrolladores, organizada por la Asociación de Industria de IA de Shanghai, en Shanghai, China, el 21 de febrero. AFP-Yonhap
DeepSeek envió ondas de choque a través de la comunidad de inteligencia artificial (IA) de China después de que sus modelos de bajo costo alteraran la forma convencional de pensar en la industria, lo que llevó a otras startups a lanzar modelos de código abierto y buscar financiación fresca.
Un derivado de un fondo de cobertura propiedad de Liang Wenfeng, DeepSeek acaparó titulares por su impacto en Wall Street y Silicon Valley. La startup con sede en Hangzhou también ha dominado el centro de atención en la arena de IA de China a expensas de sus pares locales como Moonshot AI y MiniMax.
En julio de 2024, cuando DeepSeek lanzó su modelo V2, que provocó una guerra de precios en el mercado de IA de China, Liang dijo en una entrevista que la empresa había "accidentalmente" llegado a ser el "pez gato" en la industria, ya que no tenía la intención de interrumpir el sector. Pero cuando DeepSeek lanzó el V3 en diciembre pasado y el R1 en enero de este año, la firma planteó preguntas existenciales para muchos actores en el abarrotado mercado de modelos de IA de China.
Sin embargo, la interrupción de DeepSeek parece haber dado a China "la ventaja" en términos de capacidades de modelos de IA fuertes y democratizando el acceso a la tecnología para que más empresas persigan una mayor innovación.
"Antes de R1 de DeepSeek, muchas startups de IA chinas estaban empezando a pivotar y enfocarse en aplicaciones orientadas al consumidor, impulsadas por la misma estrategia de monetización de la era del internet móvil", dijo la analista de IA Grace Shao, fundadora del boletín de la industria AI Proem. "Mientras tanto, en EE.UU., la IA se ha difundido en gran medida como una forma de empoderar a las empresas y aumentar la productividad de los trabajadores de oficina".
Shao señaló que los enfoques divergentes son causados por diferencias económicas estructurales entre los mercados de EE.UU. y China. Añadió que las fuertes capacidades de modelos siguen siendo la base de la industria de IA.
Por lo tanto, otros desarrolladores de modelos de IA de China se están moviendo para cerrar la brecha con DeepSeek en términos de lograr grandes avances en IA.
La startup Zhipu AI, con sede en Pekín, que recibió apoyo de la Universidad de Tsinghua en 2019, anunció el lunes que ha recaudado 1 mil millones de yuanes (140 millones de dólares), incluida la financiación del gobierno municipal de Hangzhou, capital de la provincia de Zhejiang, donde ha establecido una subsidiaria.
Zhipu AI —también respaldada por inversionistas reconocidos como Qiming Venture Partners, Hillhouse Capital, Legend Capital y HongShan— se unió a la ola del código abierto al hacer disponibles sus modelos y agentes de IA para los desarrolladores. El martes, lanzó su último modelo de texto a imagen de código abierto, CogView-4, que puede generar caracteres chinos.
El código abierto permite el acceso público al código fuente de un programa de software, lo que permite a los desarrolladores de terceros modificar o compartir su diseño, reparar enlaces rotos o aumentar sus capacidades. Las tecnologías de código abierto han sido una gran contribución a la floreciente industria tecnológica de China en las últimas décadas.
"Para la generación de empresarios nacidos en los 80 y 90, hay un deseo de demostrar al mundo que las empresas chinas pueden innovar, en lugar de solo 'copiar'", dijo Shao, agregando que esto ha ayudado a alimentar la actual tendencia de código abierto en el desarrollo de IA.
"Es más emocionante ser citado o utilizado por desarrolladores y empresas fuera de China que ganar dinero con un solo proyecto", agregó.
Stepfun, una startup de IA con sede en Shanghái, fundada en 2023 por el ex jefe de Microsoft Research Asia, Jiang Daxin, introdujo el mes pasado dos modelos multimodales de código abierto: Step-Video-T2V, que genera videos a partir de texto, y Step-Audio para interacciones de voz. La compañía también planea lanzar un modelo de imagen a video este mes.
Los patrocinadores de Stepfun incluyen al Capital Investment, de propiedad municipal de Shanghái, al gigante de internet Tencent Holdings, a Qiming Venture Partners y a 5Y Capital, según la última ronda de financiación de la startup anunciada a finales de 2024.
MiniMax, conocido por sus populares aplicaciones de IA personalizadas Talkie y su gemelo nacional Xingye, se unió a la ola del código abierto en enero poco después del lanzamiento del V3 de DeepSeek, con su modelo de lenguaje grande (LLM) MiniMax-Text-01, junto con el MiniMax-VL-01, un modelo multimodal. LLM es la tecnología que subyace a los servicios de IA generativa como ChatGPT y el Ernie Bot de Baidu.
"Si tuviera la oportunidad de hacerlo de nuevo, habría elegido el código abierto desde el primer día", dijo el fundador Yan Junjie en una entrevista con el medio de comunicación chino LatePost.
Moonshot AI, conocido por su chatbot Kimi, lanzó un modelo de razonamiento multimodal de nivel o1 llamado K1.5 en enero, coincidiendo con el lanzamiento del R1 de DeepSeek. El mes pasado, Moonshot AI introdujo algunas innovaciones de arquitectura de código abierto y optimizadores.
Baichuan AI, fundada por el exdirector ejecutivo de Sogou, Wang Xiaochuan, ha perfeccionado su enfoque en el sector médico. A principios de esta semana, la empresa despidió a su equipo de servicios financieros. Baichuan confirmó el movimiento de reestructuración al South China Morning Post, diciendo que estaba "optimizando y ajustando el negocio financiero para concentrar recursos y enfocarse en nuestros negocios médicos centrales".
01.AI, fundado por el ex presidente de Google China, Lee Kai-fu, ha cambiado su enfoque de entrenar modelos de IA a gran escala para afinar su atención en aplicaciones específicas de la industria. A principios de este año, la startup se asoció con la unidad de servicios de computación en la nube del Grupo Alibaba Holding para construir un "laboratorio conjunto de modelos industriales", con varios empleados de 01.AI transicionando a Alibaba Cloud como parte de la colaboración. Alibaba posee el Post.
Lee el artículo completo.
IA, China, DeepSeek