Saltar al contenido
detector de ia
Modelos de IA

Modelos de IA y su detectabilidad

Los principales modelos de lenguaje evaluados en nuestro benchmark. Qué tan detectables son y por qué.

GPT-4o
OpenAI

El modelo más analizado. Detectabilidad alta en versiones estándar; reducida con instrucciones de estilo.

Detectabilidad: Muy detectable
Claude 3.5 Sonnet
Anthropic

Estilo más variado que GPT. Las versiones recientes son más difíciles de detectar en textos largos.

Detectabilidad: Detectable
Gemini 1.5 Pro
Google DeepMind

Integra SynthID (marca de agua criptográfica) para verificación nativa. Buena resistencia estadística.

Detectabilidad: Moderadamente detectable
Llama 3.1 70B
Meta AI

Modelo open-source. Alta detectabilidad en configuración estándar; muy variable con fine-tuning.

Detectabilidad: Detectable
Mistral Large
Mistral AI

Modelo europeo con buena fluidez en español. Menor cobertura en benchmarks de detección.

Detectabilidad: Moderadamente detectable
Qwen 2.5
Alibaba Cloud

Muy capaz en chino y español. Escasa cobertura en benchmarks de detección en español.

Detectabilidad: Poco estudiado

Por qué varía la detectabilidad entre modelos

Cada modelo de lenguaje tiene una "firma estadística" distinta determinada por su arquitectura, datos de entrenamiento y proceso de fine-tuning. Los detectores aprenden a reconocer estas firmas, lo que significa que un detector puede tener alta precisión contra GPT-4o y menor contra Gemini.

El efecto de las instrucciones de estilo

Un modelo con alta detectabilidad en configuración estándar puede reducirla significativamente con instrucciones de estilo: "escribe de forma coloquial", "incluye opiniones personales", "varía la longitud de las oraciones". Esto no cambia el modelo, pero sí altera las señales estadísticas que los detectores buscan.

Marcas de agua criptográficas

Gemini implementa SynthID, un sistema de marcas de agua que incrusta señales imperceptibles durante la generación. A diferencia de la detección estadística, las marcas de agua no generan falsos positivos y son robustas frente al parafraseo. Ver definición completa.

Preguntas frecuentes

¿Qué modelo de lenguaje es el más difícil de detectar?

En nuestro benchmark, Gemini 1.5 Pro es el modelo más difícil de detectar con métodos estadísticos convencionales. Su integración con SynthID ofrece una vía de verificación alternativa, pero los detectores basados en perplejidad tienen menor precisión contra este modelo comparado con GPT-4o o Claude.

¿Los detectores identifican qué modelo específico generó un texto?

Algunos detectores como Originality.ai ofrecen estimaciones del modelo probable, pero la precisión de esta atribución es considerablemente menor que la detección binaria. Identificar el modelo exacto es un problema mucho más complejo, ya que las diferencias estadísticas entre modelos son sutiles.

¿Cómo cambia la detección cuando se mezcla texto humano con IA?

Los textos mixtos son el escenario más difícil para los detectores. Cuando un usuario edita parcialmente texto generado por IA o intercala párrafos propios, las señales estadísticas se diluyen. Los detectores con análisis por oración, como GPTZero, manejan mejor estos casos al identificar segmentos individuales.

¿Los modelos más recientes son más difíciles de detectar que los antiguos?

En general, sí. Cada generación de modelos produce texto con mayor variación estilística y menor predecibilidad estadística. GPT-4o es más difícil de detectar que GPT-3.5, y los modelos entrenados con RLHF generan texto que se acerca más a los patrones humanos en métricas como burstiness y diversidad léxica.