Tecnología

El nuevo modelo de IA Claude de Anthropic puede usar un PC ‘como lo hacen las personas’

Published October 23, 2024

Si te preocupa que la inteligencia artificial pueda quitarte tu trabajo, lo mejor es que te sientes. La startup de IA Anthropic ha demostrado un nuevo modelo llamado "Claude" que tiene la capacidad de observar la pantalla de una computadora y operar un mouse y teclado virtual "como lo hacen las personas", según su material promocional.

En una demostración en video, el investigador Sam Ringer muestra a Claude realizando un poco de trabajo de entrada de datos, conocido como "trabajo rutinario", utilizando capturas de pantalla de un escritorio de Mac para encontrar información relevante y enviar un formulario. Este tipo de trabajo es, sin duda, lo que los empleados realizan a diario en todo el mundo, aunque Ringer señala que este es un "ejemplo representativo". No se sabe exactamente cuánto del video ha sido editado.

No es necesario confiar únicamente en la palabra de Anthropic. Una versión inicial de la API Claude 3.5 Sonnet está disponible para probar ahora mismo, y Ethan Mollick, un profesor que estudia IA en la Wharton School de la Universidad de Pensilvania, lo ha hecho. Mollick probó la IA con Universal Paperclips, un juego en línea en el que hay una sutil trama de ciencia ficción.

Mollick apuntó el programa a la ventana del juego y "le dijo que ganara", luego se sentó y observó cómo operaba. El resultado fue fascinante. La IA fue capaz de identificar el objetivo del juego extrapolando su interfaz basada en texto, luego utilizó prueba y error para intentar ganar, que en este caso equivale a simplemente aumentar los números. Claude logró ajustar el precio de los clips de papel para incrementar sus ingresos ficticios con algunas pruebas A/B, tal como lo haría un jugador real. Sin embargo, no logró unir los pasos necesarios para optimizar el proceso, algo que sería bastante obvio para un jugador humano.

La IA real estaba "jugando" a un juego sobre una IA ficticia. Encontró algunos bucles lógicos que le impidieron avanzar de manera significativa, y la máquina virtual de Mollick se bloqueó varias veces antes de que el juego, que se extendió durante horas, pudiera completarse. Pero con una interesante sugerencia del operador humano, "eres una computadora, usa tus habilidades", se le instó a escribir un código básico para automatizar sus procesos.

Este es un ejemplo de cómo una computadora virtual escribe código virtual para jugar un juego virtual, estamos adentrándonos en un concepto de tipo Inception, aunque con un objetivo y resultado bastante básicos. Claude declaró que había "ganado" el juego al alcanzar un hito "dentro de las restricciones dadas" después de múltiples bloqueos de la máquina virtual.

No logró ganar Universal Paperclips, ni de lejos. Pero hay que tener en cuenta que jugar a este juego contextual está muy por encima de la intención de automatización original expuesta en el video de demostración de Anthropic. La capacidad de la IA para identificar un objetivo y avanzar con mínima orientación fue impresionante. La revisión completa merece ser leída.

"Claude fue flexible ante la mayoría de errores y persistente", escribe el profesor Mollick. "Hizo cosas inteligentes, como pruebas A/B. Y lo más importante, simplemente hizo el trabajo, operando casi una hora sin interrupción."

La IA Claude de Anthropic está disponible como una herramienta de texto gratuita en la web y como una aplicación en iOS y Android, con la capacidad de preguntar sobre imágenes y documentos de texto. Los últimos cambios (versión 3.5) están en vivo para la versión gratuita, pero el acceso más avanzado requiere una cuenta Pro de $20 por persona al mes, con banda ancha prioritaria y más modelos. Anthropic afirma tener actualmente clientes que incluyen docenas de empresas, notablemente Notion, Intuit (creadores de TurboTax) y Zoom.

IA, trabajo, tecnología