20 de junio de 2026
3 min lectura
Un sistema balanceado puede ahorrar el 40% de servidores. La clave está en la ley de Little y la varianza de los tiempos de servicio.
Un sistema con 100 servidores al 80% de uso puede necesitar solo 60 si se balancea la carga correctamente. La diferencia es un 40% de ahorro en infraestructura, sin perder rendimiento.
La mayoría de los sistemas distribuidos operan con un exceso de capacidad por miedo a picos de latencia. Pero el problema no es la carga media, sino la varianza en los tiempos de servicio. Un único proceso lento puede retrasar a todos los que esperan detrás.
Cuando balanceas carga de forma inteligente —no solo round-robin— reduces la cola media y, por tanto, el número de servidores necesarios para mantener la misma latencia. La ley de Little (L = λW) lo explica: menos varianza implica menos procesos en cola, y menos servidores.
“El 40% de tus servidores pueden sobrar si balanceas carga para minimizar la varianza, no solo la media.