Tecnología

El paisaje competitivo de los agentes de IA y las innovaciones de Manus AI

Published March 11, 2025

Manus AI, desarrollado por la startup china Monica.im, está causando un gran revuelo como el primer agente de IA totalmente autónomo del mundo. Manus opera de manera independiente, ejecutando tareas complejas y en múltiples pasos sin supervisión humana. Tiene una ventaja en los estándares de evaluación GAIA, aunque presenta algunos errores y problemas. Sus competidores, como Operator y Claude, son actualmente más confiables, mientras que otros, como Google y xAI, están también en camino de alcanzar o superar sus capacidades.

¿Cuáles son las innovaciones clave de Manus AI?

Arquitectura de múltiples agentes
Manus trabaja con un sistema que supervisa sub-agentes especializados. Cada sub-agente maneja componentes específicos de una tarea, como navegación web, análisis de datos o ejecución de código, lo que le permite gestionar flujos de trabajo complejos sin problemas. Este enfoque modular le permite descomponer tareas como la selección de currículums o el análisis de acciones en pasos ejecutados de forma concurrente.

Operación asíncrona en la nube
Funcionando en un entorno en la nube, Manus procesa tareas de manera asíncrona. Los usuarios pueden iniciar una tarea, desconectarse y recibir resultados más tarde, mientras el agente sigue trabajando de manera independiente. Esta innovación respalda la adaptabilidad en tiempo real, permitiendo cambios en las instrucciones durante la tarea sin necesidad de reiniciarla.

Integración de modelos existentes con ajuste fino
En lugar de construir un nuevo modelo de base, Manus utiliza modelos de lenguaje grande existentes (como Claude de Anthropic, Qwen de Alibaba) y los ajusta para su autonomía. Este enfoque pragmático acelera el desarrollo y mejora el rendimiento al combinar tecnologías probadas con una optimización específica para tareas.

Uso avanzado de herramientas e interacción en tiempo real
Manus se integra con herramientas externas como navegadores web, APIs y entornos de código, lo que le permite obtener datos en tiempo real, ejecutar scripts y desplegar soluciones (por ejemplo, construir un sitio web desde cero). Su capacidad para "ver" e interactuar con entornos digitales imita la ejecución de tareas de forma similar a la humana.

Capacidades de memoria y aprendizaje
El agente retiene memoria contextual y aprende las preferencias del usuario con el tiempo. Por ejemplo, si se le indica que entregue resultados en una hoja de cálculo una vez, Manus AI puede aplicar ese formato a futuras tareas, reduciendo las instrucciones repetitivas del usuario.

Fundación de código abierto
Manus se basa en código abierto, con planes de liberar sus modelos públicamente bajo una licencia de código abierto.

Estas innovaciones permiten que Manus supere estándares como GAIA (General AI Assistants benchmark), donde supuestamente supera la Deep Research de OpenAI al lograr resultados de vanguardia en todos los niveles de dificultad, destacándose en razonamiento, uso de herramientas y resolución de problemas del mundo real.

Agentes autónomos competidores que son igual o mejores que Manus AI

Aunque Manus ha generado un gran entusiasmo, varios agentes competidores, existentes y emergentes, rivalizan o superan sus capacidades hasta marzo de 2025.

Panorama competitivo de los agentes de IA

Operator de OpenAI (y Deep Research)
Lanzado a finales de 2024, OpenAI Operator es un agente autónomo que realiza tareas basadas en la web, mientras que Deep Research se enfoca en análisis en profundidad. OpenAI anunció una suscripción empresarial de $20,000/mes a principios de 2025, señalando capacidades avanzadas.

Operator es eficaz en interacciones web y resultados estructurados, mientras que Deep Research iguala a Manus en los estándares de GAIA en algunas áreas. Los vastos recursos de OpenAI y su rápida iteración le dan una ventaja en refinamiento.

Pruebas iniciales muestran que Operator es más rápido (por ejemplo, completa tareas en 15 minutos frente a los más de 50 minutos de Manus en algunos casos), pero es menos autónomo, a menudo requiriendo confirmación humana. El amplio alcance de tareas de Manus (como codificación y despliegue) podría darle una ventaja, aunque los errores y la ejecución más lenta son problemas.

Claude de Anthropic con uso computacional
Lanzado a finales de 2024, la función Uso Computacional de Claude le permite interactuar con interfaces digitales de forma autónoma, ejecutando tareas como gestión de archivos y codificación básica.

El enfoque de interpretabilidad y seguridad de Claude lo hacen confiable, con menos errores que la versión beta de Manus. Sus capacidades multimodales (texto, imágenes) son robustas.

Es menos ambicioso que Manus en alcance. La estabilidad y refinamiento de Claude parecen superar a Manus en entornos controlados. La mayor autonomía de Manus viene con más fallos reportados.

Grok de xAI (Avances hipotéticos)
Hay rumores en X de que xAI podría adelantar pronto a los competidores de agentes de IA.

Se espera que la integración del conocimiento en tiempo real y el razonamiento conciso de Grok conviertan a este agente en un competidor con capacidades de uso de herramientas.

Gemini de Google con características agenciales
Se rumorea que Google tendrá agentes autónomos en 2025.

Google cuenta con acceso a datos de primer nivel e infraestructura que respaldará un agente altamente eficiente. Los primeros prototipos de agentes son excelentes en navegación web y tareas multimodales.

Evaluación crítica

Las innovaciones de Manus AI, especialmente su sistema de múltiples agentes y su autonomía en la nube, empujan los límites de la IA agencial más allá de los contrapartes occidentales, que a menudo siguen dependiendo de comandos humanos. Su ventaja en el estándar GAIA (por ejemplo, 12.2% sobre la Deep Research de OpenAI) es impresionante. Sin embargo, los comentarios de usuarios iniciales revelan errores, poca velocidad y tareas incompletas. Se necesitan más pruebas y correcciones, lo que sugiere que aún está en proceso de maduración. Operator de OpenAI y Claude de Anthropic ofrecen experiencias más pulidas, aunque con un alcance más reducido. Google y xAI se perfilan como amenazas futuras. DeepSeek-R1, aunque no es un agente completo, establece un alto estándar para el razonamiento que Manus debe igualar consistentemente.

Manus es prometedor y sus avances son reales. Sin embargo, sus competidores son ahora más confiables (Operator, Claude) o están a punto de alcanzarlo (Google, xAI).

IA, tecnología, competencia