Tecnología

StarCoder 2: La Nueva Generación de IA para Generar Código Compatible con GPUs

Published February 29, 2024

El escenario de la programación está evolucionando constantemente con el desarrollo de herramientas de inteligencia artificial (IA) que facilitan la escritura de código. Uno de los últimos avances en este campo es el lanzamiento de StarCoder 2, creado por la empresa de IA Hugging Face en colaboración con ServiceNow, una plataforma de automatización de flujos de trabajo. StarCoder 2 es una herramienta de código abierto que presenta un enfoque menos restrictivo en cuanto a licencias en comparación con otras opciones existentes. La versión original se introdujo al mercado el año pasado, y desde entonces se ha trabajado en desarrollar StarCoder 2.

Variadas Opciones para Diferentes Necesidades

StarCoder 2 no es un modelo único sino una familia de variantes de modelos de generación de código. Se ha lanzado hoy y se ofrece en tres versiones diferentes. Las dos primeras variantes están diseñadas para funcionar en la mayoría de las GPU (Unidades de Procesamiento Gráfico) de consumo actuales:

  • Un modelo de 3 mil millones de parámetros entrenado por ServiceNow.
  • Un modelo de 7 mil millones de parámetros entrenado por Hugging Face.

Además, se incluye un tercer modelo:

  • Un modelo de 15 mil millones de parámetros entrenado por Nvidia, que recientemente se ha unido al proyecto StarCoder.

Mejoras Significativas en Rendimiento

StarCoder 2 se destaca por su rendimiento mejorado, ya que ha sido entrenado con una cantidad de datos cuatro veces mayor que la versión original (67.5 terabytes frente a 6.4 terabytes). Esto se traduce en una mejora significativa en la calidad y la reducción en los costos operativos. Además, debido a que se utilizó un conjunto de datos más amplio y diverso, StarCoder 2 puede hacer predicciones más precisas y conscientes del contexto. Por ejemplo, puede sugerir formas de completar líneas de código inacabadas o resumir y recuperar fragmentos de código utilizando lenguaje natural.

Eficiencia y Ética en el Mundo del Desarrollo

StarCoder 2 no solo promete ser más eficiente que algunos de sus competidores, sino que también se enfoca en ser ético y menos problemático legalmente. A diferencia de generadores de código que incluyen código con derechos de autor, StarCoder 2 fue entrenado solo con datos bajo licencia de Software Heritage, una organización sin fines de lucro que se especializa en servicios de archivo para el código. Esto significa que ofrece la posibilidad de ser implementado localmente y 'aprender' el código fuente o la base de código de un desarrollador, lo cual es una ventaja importante para los desarrolladores y empresas preocupadas por la privacidad.

La licencia de StarCoder 2, sin embargo, puede presentar algunos problemas. Aunque es menos restrictiva, no permite su uso en todas las aplicaciones posibles. Por ejemplo, está estrictamente prohibido usar StarCoder 2 para generar aplicaciones de asesoramiento médico. Además, algunas de sus restricciones pueden resultar vagas y estar en conflicto con regulaciones relacionadas con la IA, como el Acta de IA de la UE.

IA, programación, GPU