Tecnología

Q* de OpenAI: Un posible avance hacia la inteligencia artificial general

Published November 23, 2023

Recientes rumores sugieren que un logro significativo pudo haber tenido lugar en OpenAI. Se habla de un descubrimiento denominado Q*, una variación de aprendizaje por refuerzo, o Q-learning, que podría constituir un avance preludio de la inteligencia artificial general (AGI, por sus siglas en inglés).

¿Qué es Q* y cómo podría cambiar el juego?

Q* representa una fusión entre el tradicional Q-learning y heurísticas predeterminadas, potencialmente revolucionaria por permitir a las máquinas prever con 'visión del futuro' el paso óptimo a seguir. Esto reduciría el esfuerzo inútil y eliminaría los ensayos subóptimos. Esencialmente, cualquier esfuerzo fallido, como un robot que intenta caminar y cae, se canalizaría hacia la consecución de ensayos exitosos.

Implicaciones para el aprendizaje de las máquinas

Este avance permitiría a los modelos de lenguaje grandes (LLM, por sus siglas en inglés) de OpenAI manejar directamente problemas de matemáticas y lógica sin necesidad de software externo. La implicación es que las máquinas aprenderían a sortear obstáculos típicos en la resolución de problemas complejos de manera mucho más eficiente.

El potencial para aplicaciones prácticas

Si las hipótesis sobre Q* son precisas, significaría que OpenAI ha desarrollado un algoritmo que integra eficazmente heurísticas en su proceso de Q-learning, lo cual representaría un gran salto en inteligencia artificial.

Una breve explicación del aprendizaje por refuerzo

El aprendizaje por refuerzo es un proceso donde una máquina lleva a cabo múltiples ensayos para completar una tarea. Mediante la repetición y la optimización de los pasos necesarios, se acerca paulatinamente hacia su objetivo, similar a un niño aprendiendo a caminar mediante la práctica y corrección de errores.

Q* en el contexto de la investigación actual

El Q-learning y el algoritmo A* son conocidos y han sido extensivamente estudiados, formando parte de los currículos universitarios en informática. Aunque la investigación sobre cómo combinar estos métodos ha estado en marcha desde hace años, el éxito en la implementación práctica a gran escala sería innovador.

Liderazgo y opiniones en el desarrollo de Q*

Comentarios en redes sociales de figuras prominentes en el ámbito de la IA revelan que este avance puede redefinir nuestras herramientas actuales de aprendizaje automático y posiblemente alterar los percances de liderazgo relacionados en OpenAI, con menciones a Sam Altman y discusiones sobre el impacto subestimado que la AGI tendrá en el campo.

Q-learning, heurísticas, AGI