DeepSeek: Todo lo que necesitas saber sobre la aplicación de chatbot de IA
DeepSeek ha adquirido popularidad rápidamente.
El laboratorio de IA chino DeepSeek se convirtió en un tema de conversación importante esta semana después de que su aplicación de chatbot llegó a la cima de las listas de aplicaciones de la App Store de Apple y Google Play. Los modelos de IA de DeepSeek, que fueron entrenados utilizando técnicas eficientes en cuanto a computación, han llevado a analistas de Wall Street y tecnólogos a cuestionar si Estados Unidos puede mantener su liderazgo en la carrera de IA y si la demanda de chips de IA se sostendrá.
Pero, ¿de dónde proviene DeepSeek y cómo logró alcanzar la fama internacional tan rápido?
Los orígenes de DeepSeek
DeepSeek cuenta con el respaldo de High-Flyer Capital Management, un fondo de cobertura cuantitativo chino que utiliza inteligencia artificial para informar sus decisiones de inversión.
El entusiasta de la IA Liang Wenfeng cofundó High-Flyer en 2015. Wenfeng, que supuestamente comenzó a interesarse en la inversión mientras era estudiante en la Universidad de Zhejiang, lanzó High-Flyer Capital Management como un fondo de cobertura en 2019, enfocado en desarrollar y desplegar algoritmos de IA.
En 2023, High-Flyer estableció DeepSeek como un laboratorio destinado a investigar herramientas de IA, separado de su negocio financiero. Con High-Flyer como uno de sus inversores, el laboratorio se convirtió en su propia empresa, también llamada DeepSeek.
Desde el primer día, DeepSeek construyó sus propios centros de datos para el entrenamiento de modelos. Sin embargo, al igual que otras empresas de IA en China, DeepSeek se ha visto afectada por las prohibiciones de exportación de hardware de EE. UU. Para entrenar uno de sus modelos más recientes, la empresa se vio obligada a utilizar chips Nvidia H800, una versión menos potente de un chip, el H100, disponible para las empresas estadounidenses.
Se dice que el equipo técnico de DeepSeek es en su mayoría joven. La empresa aparentemente recluta agresivamente a investigadores de IA con doctorados de universidades chinas de primer nivel. DeepSeek también contrata personas sin antecedentes en ciencias de la computación para ayudar a su tecnología a comprender mejor una amplia gama de temas, según The New York Times.
Modelos sólidos de DeepSeek
DeepSeek presentó su primer conjunto de modelos—DeepSeek Coder, DeepSeek LLM y DeepSeek Chat—en noviembre de 2023. Pero no fue hasta la primavera pasada, cuando la startup lanzó su familia de modelos de próxima generación, DeepSeek-V2, que la industria de IA comenzó a prestar atención.
DeepSeek-V2, un sistema general que analiza texto e imágenes, tuvo un rendimiento destacado en diversas pruebas de IA y fue mucho más económico de operar que modelos comparables en ese momento. Esto obligó a la competencia nacional de DeepSeek, incluidas ByteDance y Alibaba, a reducir los precios de uso de algunos de sus modelos y a ofrecer otros de manera gratuita.
DeepSeek-V3, lanzado en diciembre de 2024, solo aumentó la notoriedad de DeepSeek.
Según las pruebas internas de referencia de DeepSeek, DeepSeek V3 supera tanto a modelos descargables y de acceso público como Meta's Llama y a modelos "cerrados" accesibles solo a través de una API, como la de OpenAI, GPT-4o.
Igualmente impresionante es el modelo R1 de DeepSeek, un modelo de "razonamiento". Lanzado en enero, DeepSeek afirma que R1 tiene un rendimiento equivalente al modelo o1 de OpenAI en pruebas clave.
Al ser un modelo de razonamiento, R1 efectivamente verifica sus propias respuestas, lo que le ayuda a evitar algunos de los problemas que suelen afectar a otros modelos. Los modelos de razonamiento pueden tardar más—usualmente de segundos a minutos—en llegar a soluciones en comparación con un modelo típico sin razonamiento. La ventaja es que tienden a ser más fiables en áreas como física, ciencia y matemáticas.
Sin embargo, hay un inconveniente en R1, DeepSeek V3 y otros modelos de DeepSeek. Al ser una IA desarrollada en China, están sujetos a la supervisión de la regulación de internet de China para asegurar que sus respuestas "incorporen valores socialistas centrales". En la aplicación de chatbot de DeepSeek, por ejemplo, R1 no responderá preguntas sobre la Plaza de Tiananmen o la autonomía de Taiwán.
Un enfoque disruptivo
Si DeepSeek tiene un modelo de negocio, no está claro cuál es exactamente. La empresa establece precios para sus productos y servicios muy por debajo del valor de mercado, y ofrece algunos de ellos de manera gratuita. Además, no está aceptando dinero de inversores, a pesar de un gran interés de capital de riesgo.
La empresa afirma que avances en eficiencia le han permitido mantener una competitividad extrema en costos. Sin embargo, algunos expertos cuestionan las cifras que la empresa ha proporcionado.
Independientemente del caso, los desarrolladores han adoptado los modelos de DeepSeek, que no son de código abierto en el sentido común, pero están disponibles bajo licencias permisivas que permiten su uso comercial. Según Clem Delangue, CEO de Hugging Face, una de las plataformas que alberga los modelos de DeepSeek, los desarrolladores en Hugging Face han creado más de 500 modelos "derivados" de R1 que han acumulado un total de 2.5 millones de descargas combinadas.
El éxito de DeepSeek contra rivales más grandes y establecidos ha sido descrito como “revolucionando la IA” y “sobrevalorado”. El éxito de la compañía fue, al menos en parte, responsable de una caída del 18% en el precio de las acciones de Nvidia en enero, y provocó una respuesta pública del CEO de OpenAI, Sam Altman. En marzo, los departamentos de comercio de EE. UU. instruyeron al personal que DeepSeek estará prohibido en sus dispositivos gubernamentales, según Reuters.
Microsoft anunció que DeepSeek está disponible en su servicio Azure AI Foundry, la plataforma de Microsoft que reúne los servicios de IA para empresas bajo un solo marco. Cuando se le preguntó sobre el impacto de DeepSeek en el gasto de IA de Meta durante la llamada de resultados del primer trimestre, el CEO Mark Zuckerberg mencionó que el gasto en infraestructura de IA seguirá siendo una “ventaja estratégica” para Meta. En marzo, OpenAI calificó a DeepSeek como "subvencionada por el estado" y "controlada por el estado", recomendando que el gobierno de EE. UU. considere prohibir los modelos de DeepSeek.
Durante la llamada de ganancias del cuarto trimestre de Nvidia, el CEO Jensen Huang destacó la “excelente innovación” de DeepSeek, afirmando que estos y otros modelos de “razonamiento” son ideales para Nvidia porque requieren mucha más computación.
Al mismo tiempo, algunas empresas y países, incluidos Corea del Sur y el estado de Nueva York, están prohibiendo el uso de DeepSeek en dispositivos gubernamentales.
En cuanto al futuro de DeepSeek, no está claro. La mejora de modelos es algo asegurado, pero el gobierno de EE. UU. parece estar cada vez más preocupado por lo que percibe como una influencia externa perjudicial. En marzo, el Wall Street Journal informó que EE. UU. probablemente prohibirá DeepSeek en dispositivos gubernamentales.
Esta historia fue publicada originalmente el 28 de enero de 2025 y se actualizará regularmente.
DeepSeek, IA, Chatbot