¿IA gratuita para las fiestas? Google y el debut de xAI de Elon Musk con sus últimos modelos
¡Los amantes de la tecnología gratuita, regocíjense! Google y xAI han presentado actualizaciones bastante interesantes en sus ofertas de IA sin costo, igualando y ampliando los esfuerzos recientes de OpenAI en democratizar la tecnología.
OpenAI lanzó la última ofensiva en la competencia por captar a los usuarios con su ambicioso programa "12 Días de OpenAI" la semana pasada, donde presentó una serie de herramientas poderosas al público. Algunos de los puntos destacados de la campaña son Sora, el generador de texto a video de última generación de la empresa, el modelo de razonamiento avanzado “OpenAI o1” y SearchGPT, una sofisticada integración de búsqueda en la web.
De estos, el motor de búsqueda y el modelo de razonamiento están disponibles para usuarios gratuitos. Sora requiere una suscripción a ChatGPT Plus.
Google respondió con una serie de anuncios abarcadores para mostrar que todavía tiene mucho que ofrecer. Compitiendo directamente con Sora, se presentó Veo 2, el último modelo de generación de video de la compañía, y ya están abiertas las inscripciones para que los usuarios prueben el modelo a través de la AI Test Kitchen de Google.
"Veo crea videos con movimiento realista y salida de alta calidad, hasta 4K. Explora diferentes estilos y encuentra el tuyo con amplios controles de cámara," dice la empresa. Los clips pueden extenderse a varios minutos de duración, superando la mayoría de los mejores generadores de video que funcionan a 1080p con tiempos de ejecución más cortos.
Además, a través de la plataforma experimental Labs, el 16 de diciembre, Google presentó Whisk, una herramienta de creación de imágenes experimental que se centra en la reestilización y en el uso de entradas visuales y pictográficas para producir salidas visuales. A diferencia de los modelos tradicionales de texto a imagen, Whisk introduce un nuevo enfoque de "remix" donde los usuarios pueden crear nuevas imágenes principalmente a través de referencias visuales de sus galerías de fotos existentes, minimizando la necesidad de mensajes de texto detallados.
Las capacidades de imagen de la compañía se han mejorado aún más con el lanzamiento de Imagen 3, que ya está disponible de forma gratuita en la aplicación de chatbot Google Gemini. Este nuevo modelo trae mejoras en el renderizado de detalles, diversidad de estilos y reducción de alucinaciones. También cuenta con capacidades de generación de texto, que los modelos anteriores de Google carecían.
También disponible de forma gratuita está Gemini 2.0 Flash, un modelo actualizado que se encuentra tanto en la consola de desarrolladores de Google como en la plataforma más pulida y fácil de usar de Gemini. Google también lanzó una característica avanzada de asistente de investigación y otorgó a sus modelos la capacidad de procesar hasta 1 millón de tokens de forma gratuita en la consola de desarrolladores.
Algunos usuarios han reportado que una versión experimental de Gemini 2.0 Advanced también está disponible para probar. "Avanzado" es el modelo más poderoso de la familia Gemini, siendo "Flash" un modelo pequeño orientado a la eficiencia, y "Pro" un modelo de tamaño medio.
Grok-2 para las masas
No queriendo ser superado, xAI de Elon Musk ha entrado en la competencia, haciendo sus propios esfuerzos para democratizar el acceso a capacidades avanzadas de IA a través de la plataforma X (anteriormente conocida como Twitter).
La empresa ha lanzado una versión mejorada de su modelo Grok-2, que cuenta con mejoras sustanciales en velocidad y capacidad. La nueva iteración funciona tres veces más rápido que su predecesor, al tiempo que ofrece mejor precisión, seguimiento de instrucciones y capacidades multilingües.
Además, la semana pasada, xAI comenzó a implementar Grok para todos los usuarios de la plataforma X de forma gratuita. La integración va más allá de las capacidades básicas de chat, introduciendo características como búsqueda en la web con citas, lo que permite a los usuarios verificar información y explorar fuentes directamente a través de la plataforma.
"Hoy estamos emocionados de anunciar que comenzamos a implementar esta nueva versión de Grok-2 a todos los usuarios en X de forma gratuita. Como siempre, los usuarios Premium y Premium+ obtienen límites de uso más altos y serán los primeros en acceder a cualquier nueva capacidad en el futuro," dijo xAI en un comunicado de blog.
La compañía también ha lanzado Aurora, su propio modelo de generación de imágenes, que se ha integrado en las capacidades de Grok. Este modelo ofrece menor calidad de imagen que la integración anterior de Grok con Flux, pero es lo suficientemente bueno como para proporcionar imágenes fotorealistas con menor adherencia a los mensajes y también menor censura.
Para apoyar aún más a desarrolladores y empresas, xAI ha anunciado reducciones significativas en los precios de su acceso a la API, rebajando las tarifas a $2 por cada millón de tokens de entrada y $10 por cada millón de tokens de salida.
La competencia ha impulsado una rápida evolución en las capacidades de IA, con cada empresa empujando los límites de lo que es posible mientras hacen que estas herramientas sean más accesibles. Esta democratización podría llevarnos a una nueva era de creatividad y productividad impulsadas por la IA, ya que los usuarios obtienen acceso a herramientas que anteriormente solo estaban disponibles para desarrolladores selectos o clientes de pago.
Sin embargo, también hay una excelente opción que algunos usuarios pueden no estar considerando: la IA de código abierto. Hay modelos lo suficientemente buenos como para competir contra estos gigantes tecnológicos, que están disponibles de forma gratuita, son totalmente personalizables y dramáticamente más transparentes.
Genmo Mochi 1, Flux, Stable Diffusion y Llama-3 son excelentes opciones que podrían satisfacer tus necesidades—y probablemente incluso superar tus expectativas si les das una oportunidad. Y son gratuitos para utilizar también.
Editado por Andrew Hayward
Google, xAI, IA