La IA 'Cosmos' de Nvidia ayuda a los robots humanoides a navegar por el mundo
Nvidia ha anunciado el lanzamiento de una nueva familia de modelos de IA fundamentales llamada Cosmos, que puede ser utilizada para entrenar robots humanoides, robots industriales y coches autónomos. A diferencia de los modelos de lenguaje que aprenden a generar texto a partir de libros, artículos y publicaciones en redes sociales, Cosmos está diseñado para generar imágenes y modelos 3D del mundo físico.
Durante una presentación en la conferencia CES anual en Las Vegas, el CEO de Nvidia, Jensen Huang, mostró ejemplos de cómo Cosmos se utiliza para simular actividades dentro de almacenes. Según Jensen, Cosmos fue entrenado con 20 millones de horas de metraje real de "humanos caminando, manos moviéndose, manipulando cosas". "No se trata de generar contenido creativo, sino de enseñar a la IA a entender el mundo físico," afirmó.
Investigadores y startups están entusiasmados con la posibilidad de que estos modelos fundamentales otorguen a los robots en fábricas y hogares capacidades más sofisticadas. Por ejemplo, Cosmos puede generar metraje de vídeo realista de cajas cayendo de estanterías dentro de un almacén, lo que se puede utilizar para entrenar a un robot a reconocer accidentes. Además, los usuarios pueden ajustar los modelos utilizando sus propios datos.
Varios empresas ya están utilizando Cosmos, incluyendo startups de robots humanoides como Agility y Figure AI, así como empresas de autos autónomos como Uber, Waabi y Wayve.
Como parte de la presentación, Nvidia también anunció un software destinado a ayudar a diferentes tipos de robots a aprender a realizar nuevas tareas de manera más eficiente. Esta nueva función es parte de la plataforma de simulación de robots Isaac de Nvidia, que permitirá a los constructores de robots tomar un pequeño número de ejemplos de una tarea deseada, como agarrar un objeto específico, y generar grandes cantidades de datos de entrenamiento sintético.
Nvidia espera que Cosmos e Isaac sean atractivos para las empresas que buscan construir y utilizar robots humanoides. En la conferencia, Jensen estuvo acompañado de imágenes a tamaño real de 14 diferentes robots humanoides desarrollados por empresas como Tesla, Boston Dynamics, Agility y Figure.
Además de Cosmos, Nvidia también presentó Project Digits, un “superordenador personal de IA” que cuesta $3,000 y puede ejecutar un modelo de lenguaje grande de hasta 200 mil millones de parámetros sin necesidad de servicios en la nube como los de AWS o Microsoft. También se anunciaron las muy esperadas GPUs RTX Blackwell de próxima generación, junto con herramientas de software para ayudar a construir agentes de IA.
Nvidia, IA, robots