Tecnología

Pioneros de la IA reciben el Premio Turing por su trabajo en aprendizaje por refuerzo

Published March 5, 2025

Dos destacados científicos informáticos han sido galardonados con el Premio Turing 2024 por su trabajo en el aprendizaje por refuerzo, una disciplina en la cual las máquinas aprenden a través de un enfoque de ensayo y error basado en recompensas que les permite adaptarse en entornos controlados o dinámicos.

Andrew G. Barto, profesor emérito en la Universidad de Massachusetts Amherst, y Richard S. Sutton, profesor en la Universidad de Alberta, desarrollaron algoritmos y teorías clave a través de una serie de documentos seminales que comenzaron en la década de 1980. Esto incluye su trabajo en una técnica de refuerzo llamada aprendizaje por diferencia temporal; el dúo luego publicó un libro académico titulado Reinforcement Learning: An Introduction.

El célebre matemático Alan Turing, a quien se le atribuye el nombre del Premio Turing, también escribió un documento en la década de 1950 titulado Computing Machinery and Intelligence que cuestionó si las computadoras pueden pensar y tocó conceptos similares sobre el aprendizaje a partir de la experiencia.

En años recientes, el aprendizaje por refuerzo ha ganado más atención después de que Google DeepMind utilizara esta técnica para construir una IA que derrotó a los mejores jugadores de AlphaGo del mundo. En los últimos meses, la startup de IA china DeepSeek ha acaparado titulares por su modelo de razonamiento R1, que se basó en gran medida en el aprendizaje por refuerzo para crear modelos de base más rentables.

‘Premio Nobel de la computación’

El Premio Turing, administrado por la Asociación de Maquinaria de Computación (ACM), a menudo se ha denominado el “Premio Nobel de la computación.” Sin embargo, el propio Premio Nobel ha empezado a incursionar en el ámbito de la computación, particularmente en torno a la IA; Geoff Hinton y John Hopfield ganaron el Premio Nobel de Física por su trabajo en IA fundamental el año pasado. Esto fue seguido poco después por los galardonados con el Premio Nobel de Química, Demis Hassabis y John Jumper de DeepMind, por su trabajo en AlphaFold.

“Áreas de investigación que van desde la ciencia cognitiva y la psicología hasta la neurociencia inspiraron el desarrollo del aprendizaje por refuerzo, que ha sentado las bases para algunos de los avances más importantes en IA y nos ha brindado una mayor comprensión sobre cómo funciona el cerebro”, dijo el presidente de la ACM, Yannis Ioannidis, en un comunicado de prensa. “El trabajo de Barto y Sutton no es un peldaño del cual ahora hemos avanzado. El aprendizaje por refuerzo sigue creciendo y ofrece un gran potencial para futuros avances en computación y muchas otras disciplinas. Es apropiado que los estemos honrando con el premio más prestigioso en nuestro campo.”

Otros notables pioneros de la IA que han ganado el Premio Turing incluyen a Yann LeCun, científico jefe de IA de Meta, quien recibió el premio en 2018 junto a Geoff Hinton y Yoshua Bengio por su trabajo en redes neuronales profundas.

Barto y Sutton compartirán un premio en efectivo de 1 millón de dólares, el cual fue proporcionado con apoyo de Google.

IA, Premio, Aprendizaje