Google ha abierto el código de su herramienta de marcas de agua para texto generado por IA
Google ha hecho disponible su herramienta de marcas de agua SynthID, diseñada para ayudar a identificar texto generado por inteligencia artificial. Esta herramienta se puede usar de manera abierta a través del Google Responsible Generative AI Toolkit, según un anuncio reciente hecho por la compañía en X.
Desarrolladores ahora pueden implementar SynthID
Con la disponibilidad de SynthID, otros desarrolladores de IA generativa podrán utilizar esta tecnología para verificar si las salidas de texto provienen de sus propios modelos de lenguaje. Esto facilitará a los desarrolladores construir IA de manera responsable, explicaron desde Google.
Las marcas de agua se han vuelto cruciales a medida que los modelos de lenguaje grande se utilizan para difundir desinformación política, generar contenido sexual no consensuado y otros fines maliciosos. En California, ya se está considerando hacer obligatoria la marca de agua de IA, mientras que el gobierno de China la estableció como un requisito el año pasado. Sin embargo, las herramientas de marcas de agua todavía son un trabajo en progreso.
Detalles de la tecnología de SynthID
SynthID, que se presentó en agosto pasado, permite detectar salidas generadas por IA al incorporar una marca de agua invisible en textos, así como en imágenes, audio y video. Google indica que la versión para texto de SynthID funciona modificando ligeramente la probabilidad de ciertos tokens en el texto de salida. Esto lo hace detectable por software, pero no por humanos.
Cuando un modelo de lenguaje genera texto, lo hace un token a la vez. Cada token representa un carácter, una palabra o parte de una frase. Para crear un texto coherente, el modelo predice el siguiente token más probable. Estas predicciones dependen de las palabras anteriores y de las puntuaciones de probabilidad asignadas a cada token posible.
Por ejemplo, con la frase "Mis frutas tropicales favoritas son __". El modelo puede empezar a completar la oración con los tokens “mango”, “lichi”, “papaya” o “durian”, y cada uno recibe una puntuación de probabilidad. SynthID puede ajustar la puntuación de probabilidad de cada token en determinadas circunstancias, sin afectar la calidad, exactitud y creatividad del texto.
Este proceso se repite a lo largo del texto generato, lo que puede resultar en múltiples puntuaciones ajustadas por oración. Así, el patrón final de estas puntuaciones se considera la marca de agua. Google asegura que su sistema, que ya está integrado en su chatbot Gemini, no compromete la calidad ni la rapidez del texto generado. SynthID puede trabajar con textos tan cortos como de tres oraciones, así como con textos que han sido modificados o parafraseados.
Limitaciones y expectativas futuras
Sin embargo, presenta dificultades con textos muy breves, contenido que ha sido reescrito o traducido, y respuestas a preguntas fácticas. Google ha mencionado que "SynthID no es una solución definitiva para identificar contenido generado por IA", pero es un componente importante para desarrollar herramientas más confiables que ayuden a las personas a tomar decisiones informadas sobre cómo interactuar con contenido generado por IA.
Google, IA, SynthID