
5 de junio de 2026
3 min lectura
Un estudio sistemático muestra que eliminar una de las tres proyecciones del Transformer (Q, K o V) reduce parámetros hasta un 33% sin pérdida significativa en 12 tareas.
Un estudio sistemático publicado en ICML 2026 demuestra que eliminar una de las tres proyecciones del Transformer (Q, K o V) reduce los parámetros hasta un 33% sin pérdida significativa de rendimiento en 12 tareas diversas.
Los Transformers dominan desde la traducción automática hasta la generación de imágenes, pero su arquitectura QKV (query, key, value) se ha mantenido casi intacta desde 2017. Cada proyección añade millones de parámetros y coste computacional. Si se puede prescindir de una sin sacrificar precisión, el ahorro en memoria y tiempo de entrenamiento es enorme.
Para startups y equipos con recursos limitados, reducir un tercio del modelo significa poder ejecutar modelos más grandes en el mismo hardware, o reducir costes en la nube. Para usuarios finales, implica aplicaciones más rápidas y ligeras.
“Eliminar una de las tres proyecciones QKV reduce los parámetros del Transformer hasta un 33% sin pérdida significativa de rendimiento en 12 tareas.