Operaciones · Centralita Virtual
Monitorización y métricas en VoIP: qué medir y por qué
30 de mayo de 2026 · 6 min de lectura
Hay una frase que repito constantemente: «si no lo mides, no existe». En VoIP esto es especialmente cierto porque la percepción del usuario es subjetiva — «la llamada se oía mal» — pero las causas son siempre medibles. El problema es que la mayoría de empresas no saben qué métricas importan y acaban mirando dashboards llenos de números que no les dicen nada.
Voy a contar qué medimos en Baxilio, por qué, y qué suelo ignorar.
Las cuatro métricas que importan de verdad
1. Pérdida de paquetes (packet loss)
El audio VoIP viaja en paquetes UDP. Si un paquete se pierde, ese trozo de audio desaparece. No hay retransmisión (a diferencia de TCP), porque cuando te llegaría el paquete retransmitido, ya sería demasiado tarde — la conversación ha avanzado.
Pérdida de paquetes por debajo del 1% es generalmente imperceptible. Entre 1% y 3%, empiezas a notar pequeños cortes. Por encima del 5%, la llamada es inutilizable.
En mi experiencia, la pérdida de paquetes es la métrica más directamente correlacionada con las quejas de «se oye mal». Cuando alguien me dice que las llamadas se cortan, lo primero que miro es packet loss. El 80% de las veces, ahí está el problema.
2. Jitter
El jitter es la variación en el tiempo de llegada de los paquetes. Los paquetes RTP se envían cada 20ms, pero no siempre llegan con esa cadencia exacta. A veces llegan a 15ms, a veces a 30ms. Esa variación es el jitter.
Los endpoints VoIP tienen un «jitter buffer» que absorbe esta variación: recolecta paquetes y los reproduce a intervalos regulares. Si el jitter es mayor que el buffer, se pierden paquetes (volvemos al punto anterior).
Jitter por debajo de 30ms es aceptable. Por debajo de 15ms es bueno. Por encima de 50ms, ya estás en problemas aunque no pierdas paquetes, porque el buffer tendrá que ser tan grande que introduce retardo perceptible.
3. Latencia (round-trip time)
Cuánto tarda un paquete en ir de un extremo a otro y volver. En una conversación, la latencia end-to-end incluye: codificación del audio, empaquetamiento, tránsito por red, jitter buffer del receptor, decodificación.
Por debajo de 150ms, la conversación es fluida. Entre 150-300ms, se nota un ligero retardo pero es manejable (es lo que tienes en llamadas intercontinentales, y todos hemos aprendido a convivir con ello). Por encima de 300ms, la gente habla encima de la otra persona y la conversación se vuelve frustrante.
En llamadas nacionales con un operador SIP decente, la latencia debería estar por debajo de 50ms. Si estás viendo 200ms en una llamada Madrid-Barcelona, algo va mal en el routing.
4. MOS (Mean Opinion Score)
El MOS es un valor del 1 al 5 que intenta cuantificar la calidad percibida del audio. Originalmente se medía con personas reales escuchando muestras. Hoy se estima algorítmicamente (PESQ, POLQA, o estimaciones basadas en las métricas anteriores).
| MOS | Calidad percibida | Referencia |
|---|---|---|
| 4.3 – 5.0 | Excelente | Línea fija de calidad, Opus HD |
| 3.7 – 4.3 | Buena | Llamada VoIP típica con G.711 |
| 3.1 – 3.7 | Aceptable | Móvil con cobertura media |
| 2.5 – 3.1 | Pobre | Conversación difícil pero posible |
| < 2.5 | Inaceptable | Mejor cuelga y llama de nuevo |
En BPhone, calculamos MOS estimado para cada llamada y lo almacenamos en el CDR. Esto nos permite detectar degradaciones de calidad antes de que los usuarios se quejen. Si el MOS medio de un trunk baja de 4.0, saltamos nosotros antes de que salte el cliente.
Lo que no merece la pena medir (o no tanto)
Ancho de banda bruto. Mucha gente se obsesiona con el ancho de banda. «Tenemos fibra de 600 Mbps, imposible que sea problema de red.» Ya, pero VoIP no necesita ancho de banda, necesita calidad de red. Una llamada G.711 consume 87 kbps. Puedes tener 600 Mbps y si tu router tiene una cola congestionada, el audio se va a cortar.
Uptime del servidor al 100%. Un uptime del 99.99% suena impresionante pero significa 52 minutos de caída al año. Lo importante no es el porcentaje bruto sino cómo manejas los cortes: ¿hay failover automático? ¿Las llamadas en curso sobreviven? ¿El usuario percibe la interrupción?
Herramientas que uso a diario
Para diagnosticar problemas de calidad VoIP en tiempo real, mis herramientas de cabecera son: sngrep para capturar y analizar señalización SIP (es como Wireshark pero solo para SIP, y funciona en terminal), análisis de RTP con las estadísticas que genera nuestro propio media server, y Grafana con paneles personalizados que muestran las cuatro métricas clave por trunk, por cuenta y por llamada individual.
Recuerdo una incidencia donde un cliente reportaba cortes intermitentes siempre entre las 13:00 y las 14:00. Resulta que coincidía con la hora de la comida: todo el mundo se ponía a ver vídeos de YouTube en la WiFi de la oficina y el router, que no tenía QoS configurado, priorizaba esas descargas sobre los paquetes RTP. La solución no fue técnica de VoIP sino configurar QoS en el router para priorizar el tráfico UDP en los puertos RTP. Diez minutos de configuración, semanas de frustración resueltas.
Esa es la realidad de monitorizar VoIP: la mayoría de problemas no son de la centralita, son de la red. Y para encontrarlos, necesitas métricas.
Monitorización de calidad incluida
BPhone mide MOS, jitter, latencia y packet loss en cada llamada. Detecta problemas de calidad antes de que tus clientes los noten.
Prueba BPhone →Antonio Gutiérrez — Desarrollador e ingeniero informático en Baxilio
Antonio Gutiérrez
Desarrollador e ingeniero informático con más de 10 años de experiencia en telecomunicaciones y 8 años especializado en VoIP. Experto en desarrollo de plataformas SaaS, ha trabajado para Bayma y otros operadores de telecomunicaciones. En Baxilio lidera el desarrollo técnico de la plataforma de voz IA.