Question 1

¿Qué modelo de lenguaje es el más difícil de detectar?

Accepted Answer

En nuestro benchmark, Gemini 1.5 Pro es el modelo más difícil de detectar con métodos estadísticos convencionales. Su integración con SynthID ofrece una vía de verificación alternativa, pero los detectores basados en perplejidad tienen menor precisión contra este modelo comparado con GPT-4o o Claude.

Question 2

¿Los detectores identifican qué modelo específico generó un texto?

Accepted Answer

Algunos detectores como Originality.ai ofrecen estimaciones del modelo probable, pero la precisión de esta atribución es considerablemente menor que la detección binaria. Identificar el modelo exacto es un problema mucho más complejo, ya que las diferencias estadísticas entre modelos son sutiles.

Question 3

¿Cómo cambia la detección cuando se mezcla texto humano con IA?

Accepted Answer

Los textos mixtos son el escenario más difícil para los detectores. Cuando un usuario edita parcialmente texto generado por IA o intercala párrafos propios, las señales estadísticas se diluyen. Los detectores con análisis por oración, como GPTZero, manejan mejor estos casos al identificar segmentos individuales.

Question 4

¿Los modelos más recientes son más difíciles de detectar que los antiguos?

Accepted Answer

En general, sí. Cada generación de modelos produce texto con mayor variación estilística y menor predecibilidad estadística. GPT-4o es más difícil de detectar que GPT-3.5, y los modelos entrenados con RLHF generan texto que se acerca más a los patrones humanos en métricas como burstiness y diversidad léxica.

Modelos de IA y su detectabilidad

Por qué varía la detectabilidad entre modelos

El efecto de las instrucciones de estilo

Marcas de agua criptográficas

Preguntas frecuentes