DeepSeek: Un Cambiador de Juego en la Guerra AI entre EE. UU. y China
DeepSeek ha causado un gran impacto en el mercado tecnológico mundial justo antes del Año Nuevo Lunar, lo que ha llevado a una caída en el valor de empresas líderes en el sector de semiconductores como Nvidia. Este inicio de empresa chino ha logrado lo que alguna vez se consideró imposible en Silicon Valley.
La empresa, ubicada en Hangzhou, lanzó recientemente dos nuevos modelos de inteligencia artificial (IA), DeepSeek-V3 y DeepSeek-R1. Estos modelos fueron desarrollados con un costo y potencia computacional significativamente menores que los que utilizan las grandes compañías tecnológicas para crear modelos de lenguaje. Esta tecnología es fundamental para servicios de IA generativa como ChatGPT.
En las redes sociales, la comunidad de IA ha elogiado cómo los modelos open-source de DeepSeek han logrado igualar o incluso superar el rendimiento de productos competidores en diversas pruebas de referencia, a pesar de la creciente restricción de EE. UU. sobre el acceso de China a semiconductores avanzados y tecnologías relacionadas. Sam Altman, CEO de OpenAI, mencionó en una publicación en X lo impresionante que es el modelo R1 de DeepSeek, subrayando lo que han logrado brindar por su precio.
Liderazgo Visionario
Liang Wenfeng, el fundador y CEO de DeepSeek, habitualmente evita la atención pública. Sin embargo, ha compartido su visión sobre la formación de modelos de lenguaje y el futuro de la IA en algunas entrevistas. Al iniciar DeepSeek en mayo de 2023, Liang expresó su objetivo de investigar la inteligencia artificial general (IAG) y de hacer sus hallazgos públicos, para evitar que esta tecnología quede en manos de un pequeño grupo de personas y empresas.
Liang cree que China debe contribuir a la innovación global y no solo depender de ella. Resaltó que la curiosidad y el deseo de crear son impulsores de la innovación, más allá de satisfacer las necesidades comerciales. La decisión de su equipo de trabajar en los "desafíos más difíciles" de la industria ha dado sus frutos, al recibir amplios elogios por los modelos V3 y R1.
Equipo de Jóvenes Genios
El equipo de DeepSeek está formado casi exclusivamente por jóvenes científicos chinos de prestigiosas universidades como Tsinghua y Peking. Aunque la mayoría son recién graduados, la empresa también contrata a candidatos de doctorado y profesionales jóvenes con un par de años de experiencia.
Por ejemplo, el trabajo técnico del modelo R1 fue coautorizado por alrededor de 200 investigadores, y 18 de ellos fueron contribuyentes clave. Una ex-empleada de DeepSeek, Luo Fuli, se ha hecho famosa recientemente debido a informes de que el fundador de Xiaomi le ofreció un paquete de compensación sorprendente.
Financiamiento y Recursos Computacionales
A pesar de que el capital registrado total de DeepSeek es de solo 10 millones de yuanes, la empresa se beneficia de los recursos financeiros y la infraestructura tecnológica de High-Flyer Quant, un fondo de inversión que Liang fundó anteriormente. En julio de 2022, Liang destacó que el problema de High-Flyer Quant no era la falta de dinero, sino las restricciones de EE. UU. sobre el suministro de chips avanzados a China.
High-Flyer Quant logró acumular más de 10,000 unidades de procesamiento gráfico de Nvidia para sus operaciones. La compañía no tiene planes de recaudar fondos externos a corto plazo, una estrategia que contrasta con otras startups chinas de IA que han reunido miles de millones a través de múltiples rondas de financiamiento.
Cultura de Start-up
Liang ha afirmado que en DeepSeek no existen límites en cuanto a la implementación de recursos computacionales ni en la contratación de talento, dado que la estructura de la empresa evita capas internas. Esto crea un ambiente propicio para la rápida adaptación a los últimos desarrollos tecnológicos.
La división del trabajo en DeepSeek es natural, lo que permite a cada miembro del equipo seguir su propio camino, sin necesidad de presión adicional. Este enfoque ha permitido a la empresa mantener su enfoque en la investigación y desarrollo, dando forma a una nueva era de competencia en la tecnología de IA.
DeepSeek, IA, Nvidia, startup, China