23 de junio de 2026
3 min lectura
El modelo GLM-5.2 de 32B parámetros se ejecuta en hardware de consumo con 8 GB de VRAM gracias a Unsloth. Adiós a la dependencia de la nube.
Unsloth ha conseguido que el modelo GLM-5.2 de 32 mil millones de parámetros funcione en una GPU con solo 8 GB de VRAM. Esto significa que cualquier persona con una tarjeta gráfica de gama media puede ejecutar localmente un asistente de IA de última generación, sin depender de servidores externos ni pagar suscripciones.
Hasta ahora, los modelos grandes como GLM-5.2 requerían hardware de datacenter o servicios en la nube. Esto creaba una dependencia total de proveedores externos, con costos recurrentes y riesgos de privacidad. Con esta optimización, el usuario recupera el control: sus datos nunca salen de su máquina.
Además, el rendimiento es competitivo. GLM-5.2 supera a modelos como Llama 3.1 70B en varias tareas de razonamiento y generación de código, según benchmarks internos. Tenerlo localmente no implica sacrificar calidad.
“GLM-5.2 corre en 8 GB de VRAM: la IA de 32B parámetros ya no necesita la nube.