Tecnología

DeepSeek: ¿Una revolución en la IA?

Published January 29, 2025

En el universo de la inteligencia artificial (IA), me considero un usuario ocasional y curioso. La IA ha ido infiltrándose en mi vida diaria a lo largo de los últimos años, y al menos, los chatbots de IA pueden hacer que las tareas aburridas resulten algo menos tediosas.

Sin embargo, cada vez que empiezo a sentirme convencido de que herramientas como ChatGPT y Claude pueden mejorar mi vida, me encuentro con un muro financiero, ya que los modelos más avanzados y útiles requieren una suscripción. Entonces apareció DeepSeek.

La startup china DeepSeek hizo caer las acciones de varias grandes empresas tecnológicas tras el lanzamiento de su nuevo modelo de código abierto, DeepSeek-R1, que promete un razonamiento económico. La compañía sostiene que el rendimiento de R1 es comparable al modelo de razonamiento inicial de OpenAI, o1, utilizando una fracción de los recursos y a un costo mucho menor. Esto se traduce en un modelo de IA avanzado que es gratuito para el público y económico para los desarrolladores que quieran construir aplicaciones sobre él.

Mientras OpenAI, Anthropic, Google, Meta y Microsoft han gastado miles de millones de dólares entrenando sus modelos, DeepSeek afirma haber invertido menos de 6 millones en el equipamiento para entrenar a su predecesor, DeepSeek-V3.

Para acceder de forma ilimitada a o1 de OpenAI, necesitarás una cuenta pro que cuesta 200 dólares al mes. DeepSeek sí cobra a las empresas por el acceso a su interfaz de programación de aplicaciones (API), que permite a las aplicaciones comunicarse entre sí. No obstante, lo que DeepSeek cobra por ese acceso es solo una pequeña fracción de lo que OpenAI cobra por el acceso a o1. Por tanto, no es sorprendente que, a partir del miércoles por la mañana, DeepSeek no solo fuera la aplicación de IA más popular en las tiendas de aplicaciones de Apple y Google, sino la más popular en general.

"La principal razón por la que la gente está tan emocionada con DeepSeek no es porque sea mucho mejor que otros modelos, sino porque es un modelo abierto, y viene de un lugar donde no se esperaba", comentó Leandro von Werra, jefe de investigación en la plataforma de IA Hugging Face.

Promesas de la IA Abierta

Desde que DeepSeek hizo su aparición explosiva en la escena de la IA global, la oportunidad de que herramientas de IA sean poderosas y económicas ha captado mi atención. Me imagino un futuro donde el software de IA se construye sobre principios de código abierto, similares a los que originaron Linux y la World Wide Web.

Este pensamiento podría ser un poco ingenuo. OpenAI fue fundado inicialmente como una organización sin ánimo de lucro con la misión de crear IA para servir al mundo entero. Sin embargo, esa misión ha cambiado.

La entrada de DeepSeek en el mercado de la IA es esperanzadora para quienes sueñan con un futuro en el que la IA esté más accesible. Aunque mis experimentos con el modelo R1 mostraron que era un chatbot que funciona como otros, su forma de razonar resulta interesante. Lo más valioso es la posibilidad de que la creación de modelos de IA avanzados no necesite mil millones de dólares ni depender de grandes empresas de Silicon Valley. Esto podría dar paso a una competencia más amplia, permitiendo que más empresas desarrollen aplicaciones interesantes para la IA.

El auge de DeepSeek también sugiere que, aunque la competencia entre las industrias digitales de EE. UU. y China se intensifica, no tiene que ser un juego de suma cero.

El enfoque abierto poco convencional de DeepSeek

Aunque puede que no hayas oído hablar de DeepSeek hasta esta semana, la compañía ya había captado la atención en el mundo de la investigación de IA hace algunos años. DeepSeek surgió de High-Flyer, un fondo de cobertura chino que comenzó en 2016, dedicado a utilizar IA para anticiparse a las fluctuaciones del mercado. Sin embargo, tras una presión regulatoria de Pekín sobre el trading especulativo, Liang Wenfeng, el fundador, decidió separar esta división de investigación y crear DeepSeek.

DeepSeek se distingue al ofrecer modelos de código abierto poderosos y de bajo coste, permitiendo a los desarrolladores acceder a ellos a un precio asequible. En el mundo del software, "código abierto" significa que el código puede ser utilizado, modificado y distribuido libremente. En el contexto de IA, esto se extiende a todo el sistema, incluyendo datos de entrenamiento y licencias. Gracias al enfoque de DeepSeek, cualquiera puede descargar sus modelos, ajustarlos y ejecutarlos en servidores locales.

A diferencia de las grandes empresas de EE. UU. que han desarrollado modelos cerrados, DeepSeek ha demostrado que los modelos abiertos pueden competir con los modelos cerrados que, convencionalmente, se pensaba que eran superiores. Esto podría cambiar la percepción de lo que es posible en la IA.

Sin embargo, aunque sus modelos no son completamente de código abierto, se conocen como modelos de "pesos abiertos", donde los datos del modelo están disponibles públicamente, pero no así su data de entrenamiento. Esto ha llevado a algunos expertos, como von Werra, a trabajar en la reproducción completa de DeepSeek-R1, incluyendo sus datos, para ayudar a entender cómo DeepSeek logró su avance.

"Si más personas tienen acceso a modelos abiertos, más personas construirán sobre ellos", añadió von Werra.

A través de informes técnicos detallados bajo licencias abiertas, DeepSeek revela su funcionamiento interno, lo que contrasta con la opacidad de modelos como el de OpenAI. DeepSeek rápidamente ha demostrado que su modelo, siguiendo métricas de rendimiento, es solo superado por el de OpenAI. Sin embargo, su lentitud en el funcionamiento puede ser un inconveniente para algunos usuarios.

Un desafío para la supremacía tecnológica estadounidense

Lo más emocionante acerca de DeepSeek es su potencial para hacer que integrar IA en diversas aplicaciones sea más económico y accesible. Este circunscribe tanto a desarrolladores como a científicos que buscan innovar. Sin embargo, al mismo tiempo representa un enorme reto para las principales empresas de Silicon Valley que han creído que sus enormes inversiones serían la clave para liderar esta industria en expansión.

El impacto de DeepSeek se ha dejado sentir en el mercado, eliminando casi 1 billón de dólares en valor de acciones y deteniendo por completo el aumento de dos años en valores de empresas como NVIDIA, que proporcionó el hardware necesario para DeepSeek.

Esto además sugiere que las restricciones del gobierno de EE. UU. sobre las exportaciones de chips avanzados para frenar los avances de China podrían no haber tenido el efecto esperado. A pesar de los bloqueos, la industria de IA china ha seguido prosperando, impulsada por gigantes tecnológicos como Alibaba y Tencent.

La carrera por la supremacía en IA está en sus inicios, y lo que está claro es que los competidores buscan alcanzar la misma línea de meta. Liang ha expresado su deseo de lograr una IA general y mantener la transparencia en sus modelos. A pesar de las dudas de algunos sectores, es un momento crucial en la evolución de la tecnología.

Finalmente, está la pregunta sobre la seguridad de los datos. DeepSeek utiliza ByteDance como proveedor de nube y almacena datos de usuarios estadounidenses en servidores ubicados en China. Esto ha generado preocupaciones sobre la posibilidad de que el gobierno chino tenga acceso a esa información. Aunque DeepSeek sigue las leyes de censura chinas, todavía no está claro si está realizando vigilancia sobre los usuarios occidentales.

Es crucial que los consumidores comprendan que la mayoría de las aplicaciones populares recolectan datos de sus usuarios y que esto no es diferente en el caso de DeepSeek. La verdadera pregunta es quién es el que hace la vigilancia.

Lo que sigue supondrá más sorpresas en el ámbito de la IA. Por ejemplo, OpenAI lanzó su agente Operator, que puede utilizar un ordenador en nombre del usuario, pero a un coste mensual. Sin embargo, la comunidad también ha empezado a compartir códigos que permiten hacer algo similar con DeepSeek de forma gratuita.

IA, tecnología, DeepSeek