12 de junio de 2026
3 min lectura
Eliminar muletillas de un audio no es solo cortar silencios. Un desarrollador explica por qué la tarea es técnicamente compleja y qué herramientas existen.
Eliminar las muletillas de una grabación puede requerir más tiempo que el propio audio. Un desarrollador que creó una herramienta local para esta tarea descubrió que el proceso implica decisiones lingüísticas y técnicas que ningún software resuelve del todo.
En la era del contenido hablado (podcasts, reuniones, videoblogs), la edición de muletillas se ha vuelto una necesidad. Pero no es un simple cortar y pegar: las palabras de relleno como "um", "uh" o "eh" se integran fonéticamente con el habla circundante, y eliminarlas sin dejar un corte audible requiere algoritmos de detección y splicing precisos.
La mayoría de soluciones comerciales funcionan en la nube, lo que implica subir archivos y depender de terceros. La alternativa local, como la que propone Doug, promete privacidad, pero exige configurar modelos de reconocimiento de voz y entender los límites de la precisión automática.
erm usa el modelo de reconocimiento de voz de OpenAI Whisper para transcribir el audio y detectar muletillas, pero Whisper no siempre las identifica correctamente.ffmpeg y whisper, y ejecutar comandos en terminal.erm si te sientes cómodo con la terminal. Sigue las instrucciones en el repositorio de Doug; necesitarás Python y ffmpeg. Ideal para episodios de podcast donde la privacidad importa.“Eliminar muletillas de un audio no es recortar silencios: es un problema de lingüística computacional que aún no tiene solución perfecta.