La nueva herramienta Deep Research de OpenAI ofrece a los estudiantes una alternativa para redactar trabajos académicos
OpenAI ha presentado una nueva herramienta llamada Deep Research para su modelo ChatGPT, diseñada especialmente para ayudar en la creación de trabajos de investigación. Sin embargo, Google también lanzó una herramienta similar, conocida como Gemini 2.0, a finales del año pasado.
Pocos estudiantes pueden decir que nunca escribieron un trabajo de última hora justo antes de su fecha de entrega. Ya hay herramientas de inteligencia artificial que permiten a los alumnos falsificar sus trabajos, y ahora, con Deep Research de OpenAI, los estudiantes cuentan con un recurso que les facilita esta tarea, a menos que se les pida citar fuentes diferentes de Wikipedia.
La herramienta Deep Research, que se basa en el modelo GPT-4o de OpenAI y fue lanzada recientemente, tiene similitudes con la funcionalidad de Gemini 2.0 de Google. Ambas herramientas actúan como agentes de inteligencia artificial capaces de realizar múltiples búsquedas por internet y razonar sobre el siguiente paso para generar un informe.
El nuevo recurso está disponible para los suscriptores de ChatGPT Pro, que paga $200 al mes, en una nueva pestaña debajo de la ventana de entrada. En esencia, la herramienta se encarga de buscar información y de seleccionar las fuentes necesarias, lo que elimina el trabajo manual de investigación.
Por ejemplo, OpenAI pidió a ChatGPT que investigara sobre las tasas de adopción de iOS y Android, así como el porcentaje de personas interesadas en aprender un nuevo idioma, y luego encontrara “mercados en los que ChatGPT podría expandirse mejor”. La interfaz del chatbot pidió aclaraciones sobre varios puntos, similar a las preguntas que podría hacer un profesor en un curso avanzado.
A diferencia de la herramienta de Google, Deep Research de OpenAI trabaja en un panel lateral y va informando al usuario sobre su progreso. En un ejemplo compartido por OpenAI, la inteligencia artificial consulta encuestas sobre el aprendizaje de idiomas por país y detalla, “estoy buscando encuestas y reportes recientes sobre la penetración de smartphones y la adopción de sistemas operativos para entender tendencias digitales e interés por idiomas a nivel global.”
En ocasiones, el bot cita las fuentes que está considerando, predominantemente Wikipedia. En el caso del estudio de mercado mencionado, el bot revisó Wikipedia repetidamente, tal como haría un estudiante que deja todo para el último minuto. Cabe recordar que se trata de un bot que navega por la web, lo que significa que no tendrá acceso a libros no digitalizados ni a contenido detrás de muros de pago.
Una vez que el chatbot genera el informe, se puede encontrar toda la lista de fuentes en un panel separado. Dado que funciona como una especie de máquina de búsqueda automática, la inteligencia artificial no siempre tendrá acceso a encuestas grandes y actualizadas de empresas de análisis importantes. En el trabajo final sobre tasas de adopción de smartphones, el bot citó datos de fuentes confiables como Pew Research, pero también incluyó diversas fuentes como Wikipedia, Statista y una revista de la industria de los Emiratos Árabes Unidos, Gulf Business. Esto no significa que la información sea de baja calidad, pero quienes generen un informe dependerán de datos que podrían ser cuestionables y de la interpretación que haga la inteligencia artificial de esos datos.
En uno de los ejemplos de OpenAI sobre “Viajes Supersónicos Civiles – Análisis del Mercado a 10 años” (con un título destacado), la inteligencia artificial citó Wikipedia, la página web de Boom Supersonic, desarrolladora del avión XB-1, y la portada de varias publicaciones del sector. En otro caso, OpenAI indicó que su modelo podía encontrar múltiples trabajos sobre temas avanzados en biología, aunque un trabajo de investigación sobre un episodio de Counterpart tomó partes de su contenido de un wiki hecho por fans.
El proceso de generación de informes suele llevar más tiempo que cualquier solicitud típica de ChatGPT. Dependiendo de la profundidad de la solicitud, este podría variar de menos de 10 minutos a más de 30. OpenAI asegura que lo que proporciona suele tomar “muchas horas” a un humano. La empresa, liderada por Sam Altman, afirmó que su herramienta Deep Research obtuvo mejor puntuación que Gemini Thinking, GPT-4o y en la prueba Humanity’s Last Exam, un test de referencia de la Center for AI Safety. Si el nombre de esta prueba suena similar a la preocupación de OpenAI y Altman sobre el futuro de la inteligencia artificial, es porque el grupo que desarrolló el test tiene vínculos estrechos con la industria de la inteligencia artificial y los multimillonarios tecnólogos.
OpenAI reconoció que Deep Research es “muy intensivo en computación”. Sin embargo, está trabajando en crear una versión que permita a los suscriptores Plus y Team utilizarlo en el futuro, probablemente usando un modelo de inteligencia artificial menos potente. La mayoría de los estudiantes universitarios no estarán dispuestos a pagar $200 al mes por una herramienta de trampa. Eventualmente, aquellos que no puedan gastar tanto también podrían beneficiarse de esta máquina que cita Wikipedia.
OpenAI, DeepResearch, inteligenciaArtificial