Tecnología

El nuevo agente de ‘investigación profunda’ de OpenAI sigue siendo solo una herramienta falible – no un experto a nivel humano

Published February 12, 2025

El "investigación profunda" de OpenAI es la última herramienta de inteligencia artificial (IA) que está causando sensación y prometiendo realizar en minutos lo que tomaría horas para un experto humano.

Integrado como una función en ChatGPT Pro y promovido como un asistente de investigación que puede igualar a un analista capacitado, este agente busca en la web, compila fuentes y entrega informes estructurados. De hecho, obtuvo un 26.6% en el Examen Final de la Humanidad (HLE), un riguroso estándar para IA, superando a muchos otros modelos.

Sin embargo, la investigación profunda no cumple completamente con las expectativas. Aunque produce informes bien elaborados, también presenta serias deficiencias. Según periodistas que lo han probado, la investigación profunda puede omitir detalles clave, tener problemas con información reciente y, en ocasiones, inventar datos.

OpenAI señala esto al listar las limitaciones de su herramienta. La empresa también menciona que "a veces puede alucinar hechos en las respuestas o hacer inferencias incorrectas, aunque a una tasa notablemente más baja que los modelos existentes de ChatGPT, según evaluaciones internas".

No es sorprendente que datos poco fiables puedan introducirse, ya que los modelos de IA no "saben" las cosas de la misma forma en que lo hacen los humanos.

La idea de un "analista de investigación" de IA también plantea muchas preguntas. ¿Puede una máquina, por poderosa que sea, realmente reemplazar a un experto capacitado? ¿Cuáles serían las implicaciones para el trabajo del conocimiento? ¿Y realmente la IA nos está ayudando a pensar mejor, o simplemente facilita la interrupción del pensamiento?

¿Qué es la ‘investigación profunda’ y para quién es?

Dirigido a profesionales en finanzas, ciencia, política, derecho e ingeniería, así como a académicos, periodistas y estrategas de negocios, la investigación profunda es la última "experiencia agente" que OpenAI ha lanzado en ChatGPT. Promete hacer el trabajo pesado de la investigación en minutos.

Actualmente, la investigación profunda solo está disponible para usuarios de ChatGPT Pro en Estados Unidos, a un costo de 200 dólares al mes. OpenAI ha dicho que se lanzará a los usuarios de Plus, Team y Enterprise en los próximos meses, con una versión más asequible planificada para el futuro.

A diferencia de un chatbot estándar que ofrece respuestas rápidas, la investigación profunda sigue un proceso de varios pasos para producir un informe estructurado:

  1. El usuario envía una solicitud. Esto podría ser cualquier cosa, desde un análisis de mercado hasta un resumen de un caso legal.
  2. La IA aclara la tarea. Puede hacer preguntas de seguimiento para refinar el alcance de la investigación.
  3. El agente busca en la web. Navega automáticamente por cientos de fuentes, incluyendo artículos de noticias, trabajos de investigación y bases de datos en línea.
  4. Sintetiza sus hallazgos. La IA extrae puntos clave, los organiza en un informe estructurado y cita sus fuentes.
  5. Se entrega el informe final. En un plazo de cinco a 30 minutos, el usuario recibe un documento de varias páginas – potencialmente incluso una tesis de nivel doctoral – resumiendo los hallazgos.

A primera vista, parece una herramienta de ensueño para los trabajadores del conocimiento. Sin embargo, un examen más detallado revela limitaciones significativas.

Muchas pruebas tempranas han expuesto deficiencias:

  • Le falta contexto. La IA puede resumir, pero no comprende completamente lo que es importante.
  • Ignora desarrollos nuevos. Ha pasado por alto fallos legales importantes y actualizaciones científicas.
  • Inventa información. Al igual que otros modelos de IA, puede generar información falsa con confianza.
  • No puede distinguir entre hechos y ficción. No diferencia entre fuentes autorizadas y no fiables.

Aunque OpenAI sostiene que su herramienta rivaliza con analistas humanos, la IA inevitablemente carece del juicio, la supervisión y la experiencia que hacen valiosa una buena investigación.

Lo que la IA no puede reemplazar

ChatGPT no es la única herramienta de IA que puede recorrer la web y producir informes con solo unos pocos comandos. Notablemente, solo 24 horas después del lanzamiento de OpenAI, Hugging Face lanzó una versión gratuita y de código abierto que casi iguala su rendimiento.

El mayor riesgo de la investigación profunda y otras herramientas de IA comercializadas para la investigación “a nivel humano” es la ilusión de que la IA puede reemplazar el pensamiento humano. La IA puede resumir información, pero no puede cuestionar sus propias suposiciones, resaltar vacíos de conocimiento, pensar creativamente o entender diferentes perspectivas.

Y los resúmenes generados por la IA no igualan la profundidad de un investigador humano capacitado.

Cualquier agente de IA, por rápido que sea, sigue siendo solo una herramienta, no un reemplazo para la inteligencia humana. Para los trabajadores del conocimiento, es más importante que nunca invertir en habilidades que la IA no puede replicar: pensamiento crítico, verificación de hechos, experiencia profunda y creatividad.

Si deseas utilizar herramientas de investigación de IA, hay maneras de hacerlo de forma responsable. Un uso reflexivo de la IA puede mejorar la investigación sin sacrificar precisión o profundidad. Podrías utilizar IA para aumentar la eficiencia, como resumiendo documentos, pero mantener el juicio humano para tomar decisiones.

Verifica siempre las fuentes, ya que las citas generadas por IA pueden ser engañosas. No confíes en las conclusiones ciegamente, sino aplica pensamiento crítico y contrasta la información con fuentes reputadas. Para temas de alta importancia, como salud, justicia y democracia, complementa los hallazgos de IA con la entrada de expertos.

A pesar del marketing prolífico que intenta decirnos lo contrario, la IA generativa todavía tiene muchas limitaciones. Los humanos que pueden sintetizar información creativamente, desafiar suposiciones y pensar críticamente seguirán siendo demandados: la IA aún no puede reemplazarlos.

IA, investigación, humano