Ir al contenido principal

SynthID de Google: Una guía con ejemplos

Descubre qué es SynthID de Google, cómo funciona y cómo implementar una marca de agua SynthID en texto.
Actualizado 8 jul 2025  · 8 min de lectura

Con la rápida difusión de los contenidos generados por IA y los avances tecnológicos, distinguir entre el material creado por humanos y el creado por máquinas es cada vez más difícil y, al mismo tiempo, más importante.

Las herramientas de marca de agua con IA, como SynthID, tienen como objetivo hacer trazable el origen del contenido digital y ayudar a los usuarios a verificar su autenticidad. En este artículo, explicaré qué es SynthID, cómo funciona y cómo puedes utilizarlo para aplicar marcas de agua al texto.

¿Qué es SynthID?

SynthID es una herramienta desarrollada por Google DeepMind que incrusta marcas de agua invisibles en contenidos generados por IA. Estas marcas de agua están diseñadas para ayudar a identificar si un contenido multimedia ha sido creado por inteligencia artificial.

El objetivo del marcado digital mediante IA es hacer que el contenido digital sea más transparente y rastreable, especialmente a medida que la IA avanza. Sin marcadores fiables, el material generado por IA puede mezclarse fácilmente y difundirse sin ser detectado, lo que da lugar a diversos problemas, como la difusión de noticias falsas y deepfakes o el uso no autorizado de obras creativas.

SynthID admite marcas de agua en texto, imágenes, vídeo y audio. Su enfoque se adapta a cada tipo de medio, lo que exploraremos en detalle más adelante. La marca de agua está diseñada para resistir ediciones comunes como recortes, ruido, compresión, recorte y filtrado, lo que la hace increíblemente resistente.

SynthID ya está integrado en los productos de IA generativa de Google: Gemini para texto, Imagen para imágenes, Lyria para audio y Veo para vídeo. Esto significa que estos modelos pueden incrustar marcas de agua imperceptibles directamente en su resultado. En combinación con el portal SynthID Detector, Google ofrece una solución completa de marca de agua que permite a los usuarios verificar rápidamente el contenido generado por IA en todos los formatos compatibles.

¿Cómo funciona SynthID?

El proceso detallado de la marca de agua depende del formato del medio. Explicaré su procedimiento y resistencia uno por uno.

SynthID para imágenes y vídeos

Para los datos de imágenes, SynthID utiliza dos redes neuronales. El primero modifica sutilmente los valores de color individuales (valores de píxeles) de la imagen de forma tan mínima que el ojo humano no puede percibir ninguna diferencia.

Los cambios se seleccionan de tal manera que la marca de agua sigue siendo detectable para la segunda red neuronal incluso después de ediciones típicas de imágenes como recorte, compresión, filtrado, rotación o incluso capturas de pantalla. Esto hace que la marca de agua sea especialmente resistente a las manipulaciones habituales que suelen producirse cuando se comparten o reutilizan imágenes.

SynthID para vídeos

Cada fotograma de un vídeo recibe el mismo tratamiento que las imágenes individuales: cada fotograma se marca individualmente con una marca de agua, lo que garantiza que la marca siga siendo detectable independientemente de cuánto se recorte el vídeo. Esto hace que la marca de agua invisible de SynthID sea resistente a ediciones básicas como recortes, compresión o recortes menores.

Los usuarios decididos o los servicios comerciales de elusión pueden seguir eliminando u ocultando la marca de agua, especialmente cuando están motivados por pasar los filtros multimedia de las plataformas publicitarias o por moderar contenidos. Por ejemplo, aplicar filtros agresivos, como la distorsión del color o cambios extremos de contraste, o recodificar el vídeo con ajustes importantes en la compresión, la velocidad de fotogramas o el perfil de color, puede degradar la marca de agua lo suficiente como para dificultar su detección fiable.

SynthID para audio

En el caso del audio, SynthID convierte la forma de onda en un espectrograma, que es una representación visual del espectro de frecuencias de una señal de audio a medida que cambia con el tiempo. A continuación, incrusta la marca de agua en el espectrograma y, por último, reconstruye el audio a partir de él. La marca de agua permanece inaudible, pero es resistente al procesamiento de audio estándar.

Para manejar formatos convencionales, la marca de agua se incrusta de manera que resiste la compresión con pérdida. Sin embargo, manipulaciones extremas como el cambio de tono o el estiramiento del tiempo pueden distorsionar el espectrograma, reduciendo la precisión de la detección. Además, aunque es resistente a la compresión MP3, la eficacia de SynthID puede variar en función de los formatos de audio propietarios.

SynthID para texto

Cuando un LLM genera texto, descompone el lenguaje en tokens (palabras, caracteres o partes de palabras) y, a continuación, predice el siguiente token basándose en puntuaciones de probabilidad. SynthID utiliza esta característica para incrustar marcas de agua durante el proceso de generación ajustando estas puntuaciones de probabilidad. La modificación se realiza de forma controlada y pseudoaleatoria, lo que hace que ciertas palabras sean ligeramente más probables.

El patrón estadístico resultante en el texto es invisible para los lectores y no afecta al significado, la calidad ni siquiera la creatividad del texto generado. Cuando es necesario realizar una detección, SynthID analiza el texto en busca de estos sutiles patrones de probabilidad y los compara con lo que cabría esperar de contenido con marca de agua frente a contenido sin marca de agua. La marca de agua suele sobrevivir a ediciones ligeras y paráfrasis, aunque puede debilitarse con reescrituras o traducciones exhaustivas.

Limitaciones de SynthID

SynthID se enfrenta a importantes limitaciones en su implementación en el mundo real. Aunque su marca de agua textual funciona de manera consistente en todos los idiomas, a diferencia de los detectores post hoc que fallan en idiomas no entrenados, las tasas de detección se desploman cuando hay mucha paráfrasis o traducción.

En el caso de las modalidades no textuales (imágenes, vídeo, audio), se echan en falta métricas de precisión publicadas, lo que impide la validación cuantitativa de las afirmaciones de Google sobre su resiliencia.

Además, la incrustación de marcas de agua resulta menos eficaz para respuestas fácticas, en las que las opciones de generación limitadas restringen la inserción de patrones sin comprometer la precisión.

Al igual que otras herramientas de detección de IA, SynthID no explica cómo llega a sus decisiones para evitar la elusión. Si se hicieran públicos los criterios o algoritmos exactos de detección, sería mucho más fácil para los usuarios manipular el contenido específicamente para evadir la detección.

Además, los modelos subyacentes son complejos y suelen funcionar utilizando patrones estadísticos o puntuaciones de probabilidad, lo que dificulta la interpretación de sus decisiones en términos sencillos, incluso para los expertos.

Actualmente, la detección más fiable de SynthID se consigue con contenido generado por los propios modelos de Google, donde la marca de agua está profundamente integrada. Aunque existe una versión de código abierto de SynthID-Text que se puede utilizar con modelos lingüísticos compatibles a través de Hugging Face Transformers, las tasas de detección y la solidez son, en general, inferiores a las de las implementaciones nativas de Google.

Como resultado, la aplicabilidad universal de SynthID sigue siendo limitada y es posible que no identifique de forma coherente el contenido generado por IA de otros proveedores, como OpenAI o Meta, especialmente cuando el contenido es editado por diferentes sistemas de IA.

Implementación práctica: SynthID para texto

¡Empecemos! No necesitas ningún acceso especial a la API de Google: SynthID funciona localmente dentro del marco de trabajo de transformers. Todo lo que necesitas es:

  • Un entorno Python (versión 3.8 o superior) con los paquetes transformers y torch instalados.
  • Acceso a un LLM a través de Hugging Face.

Creación del entorno

El entorno Python podría, por ejemplo, configurarse utilizando Anaconda y los siguientes comandos. Ten en cuenta que la versión del paquete transformers debe ser 4.46.0 o posterior para que sea compatible con SynthID para texto.

conda create -n synthid-env python=3.9
conda activate synthid-env
pip install "transformers>=4.46.0" torch

Descarga del modelo

Para la generación de texto, utilizaremos el modelo ligero gemma-2b, ya que está diseñado específicamente para funcionar de manera eficiente en hardware de consumo y, al mismo tiempo, ofrecer un rendimiento sólido en una amplia gama de tareas lingüísticas. Dado que se trata de un modelo restringido, es necesario iniciar sesión en una cuenta de Hugging Face y aceptar los términos de la licencia del modelo en el navegador.

El modelo Gemma-2b está disponible en dos formatos principales:

  1. La variante « safetensors » para su uso con PyTorch y Hugging Face Transformers.
  2. La variante gguf para motores de inferencia especializados como llama.cpp.

Para este tutorial, solo necesitas los archivos safetensors, ya que son necesarios para cargar y ejecutar el modelo en Python con transformers. Sin embargo, también debes descargar los archivos de configuración y tokenizador asociados, ya que contienen información esencial sobre la arquitectura del modelo y cómo se procesa el texto; sin ellos, el modelo no se puede cargar ni utilizar correctamente, independientemente del formato de peso que elijas.

huggingface-cli download google/gemma-2b model-00001-of-00002.safetensors model-00002-of-00002.safetensors config.json tokenizer.json tokenizer.model tokenizer_config.json special_tokens_map.json

Cargando el modelo

Para poder utilizar Gemma-2b u otros modelos con puertas de Hugging Face, también necesitamos proporcionar un token de acceso a Hugging Face. El token de acceso solo necesita permisos de lectura par, y. Al crear tu token en la configuración de Hugging Face, selecciona la función «leer»; no se requieren permisos de escritura ni de administrador.

# Logging in to Hugging Face
from huggingface_hub import login
login("<your_huggingface_token>")

Necesitamos importar AutoTokenizer y AutoModelForCausalLM desde el paquete transformers e inicializar ambos con el modelo que elijamos.

# Loading the models
from transformers import AutoTokenizer, AutoModelForCausalLM
 model_name = "google/gemma-2b"
tokenizer = AutoTokenizer.from_pretrained(generator_model_name)
model = AutoModelForCausalLM.from_pretrained(generator_model_name)

Creación de la configuración SynthID

Para aplicar marcas de agua SynthID al texto generado por IA, debes crear un objeto de configuración de marcas de agua utilizando SynthIDTextWatermarkingConfig. Este objeto controla cómo se incrustan las marcas de agua durante la generación de texto.

El parámetro « keys » es una lista de números enteros aleatorios (normalmente entre 20 y 30 valores) que sirven como tu firma digital privada. Determinan cómo se modifican sutilmente las probabilidades de elección de palabras durante la generación del texto para crear un patrón detectable. Ten en cuenta que esos keys son secretos: si se revelan, los atacantes podrían falsificar marcas de agua o generar texto con IA indetectable.

El parámetro ngram_len define la longitud de la secuencia de palabras utilizada para el análisis del patrón de la marca de agua. Cuanto más bajos sean los valores, más probable será que las marcas de agua resistan una edición intensa, pero más difíciles serán de detectar. Por el contrario, los valores más altos mejoran la detección, pero fallan ante ediciones menores. Se recomienda un valor de 5 como el mejor compromiso para el uso en el mundo real.

from transformers import SynthIDTextWatermarkingConfig
# SynthID configuration
watermark_config = SynthIDTextWatermarkingConfig(
    keys=[634, 300, 846, 15, 310, ...], # list of 20-30 integer numbers, keep this secret!
    ngram_len=5
)

Aplicar una marca de agua al texto

La indicación del texto al que se va a aplicar la marca de agua debe tokenizarse primero en un tensor PyTorch, para que el modelo obtenga los tokens numéricos que entiende. A continuación, este objeto de configuración ( tokenized_prompt ) se pasa al método de configuración del modelo ( generate() ) junto con el objeto de configuración. El parámetro « do_sample » debe establecerse en « True » para habilitar el muestreo compatible con marcas de agua.

tokenized_prompt = tokenizer(
    ["Answer in two sentences: What is AI?"],
    return_tensors=”pt”
)
output_sequences = model.generate(
    **tokenized_prompt,
    watermarking_config=watermark_config,,
    do_sample=True
)

Esto modifica las probabilidades de elección de palabras durante la generación, incorporando un patrón invisible y conservando la calidad del texto. Para garantizar la reutilización, utiliza el mismo identificador de sesión ( keys ) en todas las sesiones, de modo que las marcas de agua se puedan detectar de forma coherente.

En este ejemplo, le pedimos al modelo que nos diera su definición de IA. Veamos primero la respuesta convirtiendo los tokens de nuevo en texto legible para los humanos utilizando el método «batch_decode()».

watermarked_text = tokenizer.batch_decode(
    output_sequences , # Model's tokenized output
    skip_special_tokens=True # Removes control tokens like [BOS], [EOS], etc.
)
print(watermarked_text)
['Answer in two sentences: What is AI?

Answer:
Artificial intelligence (AI) is a branch of computer science that deals with the development of intelligent machines that can perform tasks that normally require human intelligence, such as visual perception, speech recognition, decision-making, and language translation.
AI applications include autonomous vehicles, chatbots, and virtual personal assistants.']

Cómo detectar marcas de agua generadas por IA en texto

A la hora de detectar marcas de agua SynthID en textos generados por IA, actualmente existen tres opciones prácticas disponibles.

Para demostraciones y experimentos, Hugging Face Transformers proporciona una clase de detector bayesiano. Esta clase permite probar el flujo de trabajo de detección en código Python utilizando un modelo ficticio de código abierto. Sin embargo, es importante tener en cuenta que este modelo está destinado únicamente a fines de demostración y no ofrece una precisión fiable ni una solidez apta para la producción. 

Para las organizaciones que necesitan una detección personalizada, la clase de detector bayesiano se puede utilizar para crear detectores personalizados compatibles con SynthID. Este ejemplo completo muestra cómo es posible entrenar con texto con marca de agua generado con una configuración específica y un tokenizador compartido para permitir una verificación coherente de la marca de agua en varios modelos internos.

Una vez entrenados, los detectores se pueden cargar en un repositorio privado de Hugging Face Hub para garantizar un acceso seguro a la organización, y el kit de herramientas Responsible GenAI de Google ofrece orientación adicional para su implementación en producción.

Para la detección auténtica de marcas de agua SynthID en contenido generado por los modelos de IA de Google (como Gemini o Imagen), Google ofrece un portal SynthID Detector basado en la nube. Portal SynthID Detector. El servicio es fácil de usar y no requiere codificación, pero es propietario, actualmente solo está disponible a través de una lista de espera y se limita a verificar contenido del propio ecosistema de Google. Por el momento no hay ninguna API pública ni versión local para programadores.

Más debates sobre SynthID

Estandarización y privacidad de los datos

SynthID no se ha adoptado como estándar en todo el sector, ya que los principales actores, como Microsoft y Meta, siguen utilizando sus propios sistemas de marca de agua, lo que crea un ecosistema fragmentado en el que la detección entre plataformas sigue siendo ineficaz. Actualmente, no existe un protocolo de evaluación estandarizado para la robustez de las marcas de agua en modalidades de texto, imagen, audio y vídeo.

Las asociaciones industriales, como la establecida con Nvidia, que utiliza SynthID en su plataforma Cosmos—, pero son poco frecuentes. Por lo tanto, a pesar de sus prometedoras perspectivas, SynthID aún está lejos de considerarse un estándar universalmente aceptado.

Contrariamente a lo que algunos temen, SynthID no permite de forma inherente la vigilancia ni el seguimiento de contenidos por parte de Google, ya que la marca de agua es un identificador pasivo que se incrusta en el momento de la generación y requiere que se suba voluntariamente al portal SynthID Detector para su verificación. No hay pruebas de que Google supervise la distribución o el uso del contenido más allá del proceso de escaneo y eliminación del portal. Google no ha revelado si los archivos subidos se almacenan a largo plazo o se reutilizan, lo que crea posibles brechas de privacidad.

Implicaciones legales y sociales

La eliminación de marcas de agua del contenido generado por IA complica la aplicación de los derechos de autor, especialmente desde que leyes como la Ley de IA de la UE no definen claramente la propiedad de los resultados de la IA. Aunque la ley COPIED (2024) de EE. UU. tipifica como delito dicha eliminación, los atacantes aprovechan las lagunas legales, como la traducción de textos o la reedición de contenidos multimedia, para eliminar las marcas de agua sin consecuencias legales. Esta ambigüedad deja a los creadores en una posición vulnerable.

Herramientas como SynthID, limitadas al ecosistema de Google, no logran abordar la magnitud del problema, ya que solo una pequeña parte de las publicaciones llevan marcas de agua detectables. Las marcas de agua estáticas por sí solas no pueden combatir la desinformación generada por la IA debido a vulnerabilidades técnicas, falsos positivos e incompatibilidad entre plataformas. En el peor de los casos, herramientas como SynthID podrían fomentar una confianza excesiva al sugerir una detección fiable, cuando en realidad fallan con contenidos que no son de Google o con medios editados.

Las marcas de agua generativas como SynthID-Text no son una respuesta completa a la detección de IA, sino más bien una herramienta táctica que complementa otras estrategias. Su eficacia depende de la colaboración entre los proveedores que realmente incorporan la marca de agua durante la generación del texto. Para identificar el texto generado por IA a partir de fuentes que no utilizan marcas de agua, siguen siendo necesarios métodos alternativos, como la detección a posteriori.

Conclusión

SynthID ofrece una forma de marcar con agua y verificar el texto generado por IA, lo que hace que el origen del contenido sea más transparente en la era de los medios sintéticos. Sin embargo, su eficacia se ve limitada por la falta de normas comunes en el sector y la facilidad con la que se pueden eliminar o eludir las marcas de agua.

Para obtener más información sobre el marcado de agua con IA y otras prácticas responsables de IA, no dudes en consultar estos recursos:

Temas

¡Aprende IA con estos cursos!

Curso

Ética de la IA

1 h
58.1K
Explora la ética de la IA con un enfoque en los principios, la imparcialidad, la reducción del sesgo y la confianza en el diseño de la IA.
Ver detallesRight Arrow
Comienza el curso
Ver másRight Arrow
Relacionado

blog

Los 7 mejores generadores de vídeo de IA para 2024 con vídeos de ejemplo

Descubre los mejores generadores de vídeo de IA disponibles en la actualidad, como RunwayML, Synthesia, Colossyan, Pictory, DeepBrain AI, Invideo y el esperadísimo Sora y Veo de DeepMind.
An AI juggles tasks

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.

Abid Ali Awan

10 min

blog

¿Qué es un modelo generativo?

Los modelos generativos utilizan el machine learning para descubrir patrones en los datos y generar datos nuevos. Conoce su importancia y sus aplicaciones en la IA.
Abid Ali Awan's photo

Abid Ali Awan

11 min

Tutorial

Visión GPT-4: Guía completa para principiantes

Este tutorial le presentará todo lo que necesita saber sobre GPT-4 Vision, desde cómo acceder a él hasta ejemplos prácticos del mundo real y sus limitaciones.
Arunn Thevapalan's photo

Arunn Thevapalan

Tutorial

Guía para principiantes sobre la ingeniería de avisos ChatGPT

Descubra cómo conseguir que ChatGPT le proporcione los resultados que desea dándole las entradas que necesita.
Matt Crabtree's photo

Matt Crabtree

Tutorial

Introducción a la incrustación de texto con la API OpenAI

Explore nuestra guía sobre el uso de la API OpenAI para crear incrustaciones de texto. Descubra sus aplicaciones en la clasificación de textos, la recuperación de información y la detección de similitudes semánticas.
Zoumana Keita 's photo

Zoumana Keita

Ver másVer más