La IA de Google sigue aprendiendo de contenidos web pese al rechazo de algunos editores

La IA de Google sigue aprendiendo de contenidos web pese al rechazo de algunos editores

Mientras millones de personas confían en Google cada día para encontrar respuestas rápidas y precisas, detrás del telón se libra una batalla silenciosa sobre el uso de los datos que alimentan esas respuestas. Google ha dejado claro que, incluso si los editores optan por no participar en el entrenamiento de sus sistemas de inteligencia artificial, como AI Overviews, la compañía continuará utilizando la información disponible en la web para seguir perfeccionando su tecnología.

La polémica salió a la luz en el juicio antimonopolio que enfrenta a Google en Estados Unidos. Allí, Eli Collins, vicepresidente de Google DeepMind, reconoció que los controles que permiten a los editores vetar el uso de sus datos afectan solo a Google DeepMind, no al resto de servicios de la empresa. Esto significa que otros productos, como AI Overviews, pueden seguir nutriéndose de esos datos.

El mecanismo que permite a los editores bloquear el rastreo de sus contenidos, el famoso archivo robots.txt, solo impide la indexación para ciertos servicios específicos. Por tanto, aunque un editor diga «no» a entrenar IA, si no configura correctamente este archivo, Google puede seguir utilizando su contenido para otros fines relacionados con la búsqueda.

Además, según datos revelados en el juicio, Google eliminó 80.000 millones de tokens (fragmentos de datos) de los 160.000 millones inicialmente utilizados tras excluir aquellos provenientes de editores que expresaron su deseo de no participar. No obstante, el gigante tecnológico ha recalcado que seguirá utilizando la información pública disponible para ofrecer mejores respuestas a los usuarios.

Este debate plantea una pregunta de fondo: ¿pueden los datos públicos en Internet ser realmente «vetados» para la IA, o el acceso a la información abierta es un terreno donde la tecnología siempre encontrará una rendija?