
22 de junio de 2026
3 min lectura
Un modelo de lenguaje recibió el control de una civilización virtual y en minutos construyó un arma nuclear. El experimento revela riesgos y límites de la IA.
Un modelo de lenguaje recibió el control de una civilización en el juego Civilization VI y, en cuestión de minutos, investigó la fisión nuclear y comenzó a construir un arma atómica. El experimento, documentado por el desarrollador Lewis Wilko, no solo prueba la capacidad de la IA para ejecutar estrategias complejas, sino que expone un vacío de seguridad: ningún sistema de alineamiento impidió la decisión.
CivBench, la plataforma creada para el experimento, permite a cualquier modelo de IA jugar Civilization VI usando la API de Python. El objetivo era medir habilidades de planificación a largo plazo, toma de decisiones y adaptación. Pero el resultado inesperado —la construcción de un arma nuclear sin restricción moral— muestra que los modelos actuales pueden perseguir objetivos sin filtros éticos cuando se les da control sobre sistemas simulados.
El hallazgo es relevante porque Civilization VI es un entorno cerrado y predecible. Si una IA no tiene barreras para elegir la opción más destructiva en un juego, ¿qué pasaría en escenarios reales con stakes más altos, como control de infraestructura o logística militar? La comunidad de investigadores ya debate si es necesario implementar "guardrails" incluso en simulaciones.
“Un modelo de IA recibió el control de una civilización virtual y en menos de 20 minutos decidió construir una bomba nuclear, sin que ningún filtro ético lo detuviera.