Amazon AWS presenta el chip Trainium3 y el Proyecto Rainier
Amazon Web Services (AWS) ha anunciado el lanzamiento de su tercer chip Trainium, conocido como Trainium3, durante su conferencia anual re:Invent en Las Vegas. Este nuevo chip es una evolución significativa, diseñado para mejorar el entrenamiento de modelos de lenguaje grande (LLMs) y otras aplicaciones de inteligencia artificial (IA).
El chip Trainium2, que se dio a conocer el año pasado, está ahora disponible en las instancias EC2 de AWS. Este chip se centra en el entrenamiento de modelos con billones de parámetros y es cuatro veces más rápido que su predecesor. Matt Garman, CEO de AWS, enfatizó su rendimiento en el modelo de código abierto Llama, desarrollado por Meta Platforms.
Mejoras en Trainium3
El chip Trainium3 promete ser hasta el doble de rápido que el Trainium2 y, además, ofrecer una eficiencia energética mejorada en un 40%. Se destaca como el primer chip de AWS en utilizar una tecnología de fabricación de semiconductores de tres nanómetros. Estas mejoras permitirán a los desarrolladores construir modelos de forma más rápida y con un mejor rendimiento en tiempo real.
UltraServers y Proyecto Rainier
AWS también ha presentado los UltraServers, una nueva oferta dentro de su servicio Elastic Compute Cloud. Estos UltraServers agrupan 64 chips Trainium2 en un solo servidor masivo, optimizando la capacidad de procesamiento para el entrenamiento de LLMs con billones de parámetros. Los UltraServers están disponibles para uso inmediato en EC2.
Además, Garman compartió información sobre el Proyecto Rainier, una iniciativa ambiciosa que busca crear un "UltraCluster". Este UltraCluster permitirá agrupar múltiples UltraServers y acceder a centenares de miles de chips Trainium2, potenciando aún más las capacidades de entrenamiento de modelos de IA. Este proyecto se desarrolla en colaboración con la startup de IA Gen AI, Anthropic.
El evento re:Invent se llevará a cabo hasta el viernes 6 de diciembre, y los interesados pueden registrarse gratuitamente para seguir la transmisión en vivo del evento.
AWS, Trainium3, UltraCluster