Tecnología

Google enfrenta restricciones de grandes sitios web para entrenar sus modelos de IA

Published March 15, 2024

Varios sitios web destacados recientemente han comenzado a bloquear a Alphabet Inc., la compañía matriz de Google GOOGL GOOG, impidiendo el uso de su contenido para el entrenamiento de modelos de inteligencia artificial (IA). Esta decisión parece ser una respuesta a la amenaza percibida que estos modelos de IA representan para el sistema tradicional de distribución de tráfico web.

¿Qué ha ocurrido?

Se ha desarrollado una nueva herramienta, denominada Google-Extended, que permite a los propietarios de sitios web evitar que Google use el contenido de sus páginas en el entrenamiento de modelos de IA. Originality.ai informó que cerca del 10% de los 1,000 sitios web más visitados han adoptado esta herramienta.

Entre esos sitios web se encuentran The New York Times, actualmente en una disputa de derechos de autor relacionada con la IA con el creador de ChatGPT, OpenAI, al igual que CNN, BBC, Yelp y Business Insider que también han implementado la restricción mediante Google-Extended.

Posibles Consecuencias

A pesar de estas medidas, el informe indicó que Google-Extended ha sido menos adoptada en comparación con otras herramientas bloqueadoras de datos de entrenamiento de IA, como GPTBot de OpenAI, la cual está activa en aproximadamente el 32% de los 1,000 sitios web principales.

Jonathan Gillham, CEO de Originality.ai, sugirió que la adopción menor de Google-Extended podría deberse al riesgo potencial de que los sitios web queden excluidos de los resultados generados por IA si bloquean el acceso de Google a sus datos. Por ejemplo, si un restaurante de pizza bloquea el uso de su contenido, el modelo de IA de Google no tendría conocimiento de este y no lo incluiría en sus respuestas a las consultas relevantes.

La resistencia de grandes sitios web emerge en medio de preocupaciones por el impacto de los modelos de IA en la distribución tradicional del tráfico web. The Atlantic mostró su preocupación por cómo la búsqueda mejorada por IA de Google podría responder directamente a las consultas de los usuarios, reduciendo la necesidad de que visiten otros sitios, lo cual podría disminuir significativamente el tráfico para los editores que dependen de Google.

Mientras tanto, el conflicto de derechos de autor de IA entre The New York Times y OpenAI es parte de un conflicto más amplio en la industria de la IA, el cual ha escalado recientemente con acusaciones por parte de Elon Musk contra OpenAI respecto a la fuente de datos para su modelo de IA, Sora.

Alphabet, Google, IA