Una marca de agua para las creaciones de Inteligencia Artificial Copiar al portapapeles
POR: Luis Moctezuma
5 noviembre, 2024
Actualmente el contenido generado por conversadores de Inteligencia Artificial es un reto para todo tipo de profesiones. Este tipo de sistemas están diseñados para imitar la forma en que se expresa un ser humano.
En los últimos meses Google ha puesto en marcha algo similar a una marca de agua en los textos que genera su sistema Gemini. Gracias a esto se puede reconocer sus creaciones como obra de una inteligencia artificial.
Una forma de reconocer a la Inteligencia Artificial
Un estudio publicado a finales de octubre en la revista científica Nature describe a SynthID-Text. La función de esta tecnología es ofrecer la posibilidad de reconocer material hecho con modelos de lenguaje en gran tamaño (LLM). De esta forma, podría reducirse la posibilidad de mal uso sobre el contenido que generan los conversadores basados en Inteligencia Artificial.
SynthID-Text combina un sistema de marca de agua con muestras aleatorias. Las pruebas que se han realizado hasta ahora muestran que es posible reconocer el contenido generado por LLM y el que tiene origen humano. Lo anterior sin afectar la calidad del contenido creado por los mismos LLM.
SynthID-text trabaja con Google Deep Mind. Además de texto, analiza video generado por Inteligencia artificial. Es compatible con Veo, su modelo generador de video de alta definición a partir de texto.
Entre las ventajas de SynthID-text está que no altera la calidad del texto que ofrece el sistema generador de lenguaje. Además, no es muy exigente en los requerimientos para funcionar.
¿Cómo funcionan los sistemas de lenguaje basados en Inteligencia Artificial?
Los sistemas de Inteligencia Artificial generativa funcionan mediante la probabilidad. Primero se les entrena con todo tipo de textos. Posteriormente rastrean la combinación de palabras más adecuada para responder a las preguntas que realizan sus usuarios.
En ocasiones combina las palabras. Esto lo hace sin alterar el sentido de la pregunta realizada por el usuario. Durante este reacomodo se crea ruido estadístico, que sirve como rastro para encontrar el contenido generado por Inteligencia Artificial.
Mientras más cerrada es la respuesta, la probabilidad de detectar un texto como hecho por Inteligencia Artificial es mayor. Por otro lado, si la pregunta es muy abierta y hay muchos factores aleatorios, será más difícil reconocerlo. La tasa de detección acertada en este segundo caso es de 90%.
No se trata de una herramienta infalible. La posibilidad de error existe para SynthID-text. Los textos breves son uno de sus retos. Por otro lado, si el usuario edita o parafrasea el texto será más complicado que reconozca el origen del texto.
Detectar el contenido artificial
No es ningún secreto que estamos cada vez más expuestos a contenido generado por Inteligencia Artificial. El sistema educativo lidia actualmente con la posibilidad de entregar trabajos escolares sobre los que no se tiene ningún conocimiento gracias a la Inteligencia Artificial. Otros ámbitos como el contenido digital también han aumentado considerablemente su volumen gracias a la Inteligencia Artificial.
Para crear un entorno más seguro sobre el contenido generado por Inteligencia Artificial también será necesario un sistema estandarizado. SynthID-text funciona con los sistemas de Google que dependen de Deep Mind. Sin embargo, Chat GPT de Open AI es muy popular y también tendría que ser reconocible.
Por ahora el contenido generado por algoritmos pasa desapercibido para los usuarios comunes. Sin embargo, el poder rastrear su origen será de gran ayuda para reconocer contenido auténtico de origen humano y aquel que se genera mediante algoritmos probabilísticos.
Fuente
Google crea un sistema de marcas de agua para detectar textos creados con IA