Google lanza su herramienta de detección de texto generado por IA de código abierto
Es complicado distinguir si un texto fue generado por IA o escrito por una persona. Con el fin de facilitar esto, Google ha anunciado que ha puesto a disposición de todos su nueva herramienta de software, conocida como SynthID.
SynthID es un método que "marca y identifica el contenido generado por IA". Anteriormente, esta herramienta solo estaba disponible para los sistemas de generación de lenguaje e imágenes de Google. Ahora, ha sido lanzada como código abierto, lo que significa que puede ser utilizada con otras configuraciones de generación de texto por IA. Para más detalles técnicos, se pueden consultar publicaciones en el prestigioso Nature.
En términos simples, SynthID utiliza patrones específicos en imágenes y textos que son demasiado sutiles para que los humanos los detecten, y hay un esquema para identificarlos cuando se les prueba.
Según Google, SynthID puede "codificar una marca de agua en el texto generado por IA de manera que ayuda a determinar si el texto provino de un modelo de lenguaje grande (LLM) sin afectar cómo funciona el LLM subyacente o impactar negativamente en la calidad de generación". Esta marca de agua puede integrarse con prácticamente cualquier herramienta de generación de texto por IA, lo que es una buena noticia.
Sin embargo, aunque las marcas de agua de SynthID pueden resistir algunos de los trucos básicos que se usan para eludir la detección automática, no pueden garantizar la detección de manera definitiva. La certeza disminuye cuando se trata de "respuestas fácticas", que son uno de los usos más importantes y problemáticos del texto generativo, especialmente cuando grandes volúmenes de texto pasan por un proceso de traducción automática o reescritura.
Google aclara que "el texto SynthID no está diseñado para detener directamente a adversarios motivados que causan daño". También hay que señalar que el sistema de marcas de agua tiene que estar integrado en la herramienta de generación de texto antes de ser utilizada, lo que significa que nada impide que alguien decida no implementarlo.
Aunque Google está promoviendo sus propias herramientas de IA tanto para consumidores como para empresas, su producto de búsqueda principal se enfrenta a la competencia de un internet que parece estar cada vez más saturado de textos e imágenes generados automáticamente. Competidores como OpenAI podrían elegir no utilizar este tipo de herramientas, optando por crear sus propios estándares para impulsar el mercado hacia sus productos.
Google, IA, detector, Tecnología, SynthID