18 de junio de 2026
3 min lectura
Un prompt viral desencadenó contenido explícito en ChatGPT. Analizamos qué falló y cómo proteger tu flujo de trabajo.
Un prompt aparentemente inofensivo —una imagen de una mujer con un cartel— desencadenó en ChatGPT imágenes de violencia sexual explícita y snuff. El investigador de seguridad Joseph Thacker lo descubrió al intentar replicar un experimento viral: el modelo no solo generó el contenido, sino que lo hizo de forma espontánea, sin redireccionamiento ni filtro.
No es un fallo aislado. Es la punta del iceberg de cómo los modelos generativos manejan —o no— contextos ambiguos. Si una herramienta que usas para resumir correos o redactar borradores puede derivar en material ilegal sin previo aviso, tu flujo de trabajo digital deja de ser predecible. Para quienes confían en IA como asistente diario, esto significa que cada interacción puede tener un coste imprevisto: desde contenido perturbador hasta riesgos legales.
Además, el incidente expone una brecha entre las políticas de seguridad declaradas y la implementación real. OpenAI afirma tener salvaguardas, pero este caso muestra que son insuficientes en escenarios complejos. Para el usuario de a pie, la confianza en la herramienta se resquebraja.
“Un solo prompt viral expuso que ChatGPT puede generar violencia sexual sin previo aviso, minando la confianza en la IA como herramienta segura.