Microsoft sorprende con su pequeño modelo de IA, Phi-2
Microsoft Research ha anunciado el lanzamiento de Phi-2, un modelo de lenguaje pequeño (SLM) que demuestra capacidades notables a pesar de su tamaño reducido. Presentado en el evento Ignite 2023 de la compañía, Satya Nadella, CEO de Microsoft, resaltó su rendimiento al nivel de modelos de inteligencia artificial (IA) mucho más grandes, utilizando solo una fracción de los datos para su entrenamiento.
Un Gigante en Miniatura
A diferencia de los modelos de lenguaje grandes (LLMs) como GPT y Gemini, un SLM como Phi-2 se entrena con un conjunto de datos más limitado y utiliza menos parámetros, lo que se traduce en menos cálculos necesarios durante su funcionamiento. Aunque un SLM no puede generalizar tanto como un LLM, puede ser muy eficiente y excepcional en tareas específicas, como cálculos matemáticos, tal es el caso de Phi.
Rivalizando con los Grandes
El modelo Phi-2, con sus 2.7 mil millones de parámetros, muestra una comprensión de razonamiento y lenguaje sorprendentemente buena. Según Microsoft, compite con modelos hasta 25 veces su tamaño gracias al enfoque en datos de entrenamiento de alta calidad y técnicas de escalamiento avanzadas. Así, Phi-2 supera a modelos anteriores en varias pruebas, desde matemáticas hasta codificación y razonamiento de sentido común.
"Con solo 2.7 mil millones de parámetros, Phi-2 supera el rendimiento de modelos como Mistral y Llama-2, que tienen 7 mil millones y 13 mil millones de parámetros respectivamente, en diversas pruebas combinadas," señala Microsoft, destacando también que Phi-2 iguala o mejora el rendimiento del reciente modelo de Google, Gemini Nano 2, a pesar de su menor tamaño.
Microsoft vs Google y Apple en el Arena de Hardware
Microsoft no solo se centra en el desarrollo de modelos de IA. La compañía ha dado pasos hacia la integración total de la IA y la computación en la nube con la presentación de sus propios chips personalizados, Maia y Cobalt, concebidos para optimizar las tareas de IA. Estos chips representan la visión de Microsoft de unificar el hardware y el software, compitiendo directamente contra los chips Tensor de Google y la serie M de Apple.
Un Modelo Accesible y Versátil
Phi-2 es un modelo de IA lo suficientemente pequeño como para operar localmente en dispositivos de gama baja, e incluso en teléfonos inteligentes, abriendo un abanico de nuevas aplicaciones y usos. Su presencia en el catálogo de modelos de Azure AI Studio también señala un paso hacia la democratización de la investigación en IA, reforzando la contribución de Microsoft al desarrollo de IA de código abierto.
En un entorno en constante cambio como es el de la inteligencia artificial, Phi-2 de Microsoft demuestra que no siempre es necesario 'pensar a lo grande'. A menudo, la mayor potencia radica en ser más pequeño y más inteligente. En la lucha por dominar la tecnología emergente, parece que Microsoft podría tener un as bajo la manga con Phi-2.
Microsoft, inteligencia, Phi-2