Cómo funciona la
detección de IA
Las señales estadísticas que diferencian el texto humano del generado por IA.
El problema de fondo
Los modelos de lenguaje grandes (LLMs) como GPT-4o, Claude o Gemini generan texto de forma autoregresiva: predicen la siguiente palabra más probable dado todo lo anterior. Este proceso produce texto estadísticamente predecible. Los seres humanos, en cambio, toman decisiones léxicas y estilísticas impredecibles, cometen errores intencionales y varían su complejidad de forma orgánica.
Los detectores de IA explotan estas diferencias estadísticas midiendo señales como la perplejidad, el burstiness y la diversidad léxica. Ningúna señal individual es definitiva, los detectores modernos combinan múltiples métricas en clasificadores entrenados.
Señal 1: Perplejidad
Mide cuánto se "sorprende" un modelo de lenguaje ante un texto:
PP(texto) = exp( -(1/n) × Σ log P(tᵢ | t₁…tᵢ₋₁) )
Puntuación baja = texto predecible. El texto de IA tiene baja perplejidad. Limitación: La documentación técnica y el lenguaje jurídico también tienen baja perplejidad, generando falsos positivos.
Señal 2: Burstiness
burstiness = σ(perplejidades por oración) / μ(perplejidades por oración)
Los humanos son "bursty": alternan oraciones fluidas con otras laboriosas. El texto de IA tiene perplejidad uniformemente moderada. Alta varianza → humano. Baja varianza → IA.
Señal 3: Vocabulario
- Ratio tipo-token: menor diversidad léxica en texto de IA.
- Hápax legómenon: palabras que aparecen una sola vez, más frecuentes en textos humanos.
- Frases características: "es importante destacar", "cabe mencionar", "en conclusión".
Falsos positivos: el riesgo principal
En nuestro benchmark, las tasas de FPR variaron del 7% al 17%. Un FPR del 17% significa que 1 de cada 6 escritores humanos sería falsamente acusado. Grupos especialmente afectados: hablantes no nativos y escritores de STEM.
Los detectores de IA no deben usarse como única base para decisiones de integridad académica.
Limitaciones técnicas
Los detectores estadísticos tienen limitaciones estructurales que ningún proveedor puede eliminar completamente. Los hablantes no nativos de una lengua producen texto con menor variación léxica y estructuras más predecibles, características estadísticas que se superponen con las del texto de IA. Los textos técnicos y legales también tienen baja perplejidad inherente por su vocabulario especializado. Los textos cortos (menos de 100 palabras) son fundamentalmente infiables con cualquier método estadístico.
¿Se puede evadir la detección?
Sí. Las herramientas humanizadoras reformulan texto de IA para aumentar perplejidad y burstiness. En nuestro estudio, tasas de evasión del 23% al 91%. Los enfoques más robustos combinan detección estadística con procedencia criptográfica (C2PA, SynthID). Ver benchmark de precisión.
Preguntas frecuentes
¿Qué modelos de lenguaje puede identificar un detector de IA?
Los detectores modernos pueden identificar texto generado por GPT-4o, Claude, Gemini, Llama y la mayoría de modelos grandes. Sin embargo, su precisión varía según el modelo: los detectores suelen estar mejor entrenados contra GPT porque es el modelo más utilizado y estudiado en la literatura.
¿La perplejidad es el único indicador que usan los detectores?
No. La perplejidad es la señal más conocida, pero los detectores combinan múltiples métricas: burstiness (variación de complejidad entre oraciones), diversidad léxica, distribución de longitud de oraciones y patrones de n-gramas. Los clasificadores modernos integran estas señales en modelos de aprendizaje automático.
¿Funciona la detección en textos muy cortos, como un tuit?
La detección en textos cortos (menos de 100 palabras) es fundamentalmente poco fiable. Los algoritmos necesitan suficiente masa estadística para identificar patrones, y un tuit o un mensaje breve no ofrece datos suficientes. La mayoría de detectores requieren al menos 200 palabras para resultados confiables.
¿Los detectores almacenan el texto que analizo?
Depende del proveedor. Algunos detectores como GPTZero afirman no retener el texto enviado, mientras que otros pueden almacenarlo para mejorar sus modelos. Es importante revisar la política de privacidad de cada herramienta antes de enviar textos confidenciales o académicos sensibles.