WebRTC y softphones: tu extensión en el navegador

Técnico · Centralita Virtual

WebRTC y softphones: tu extensión en el navegador

18 de abril de 2026 · 6 min de lectura

Hace diez años, si querías usar un softphone, tenías que instalar un programa, configurar un servidor SRTP, lidiar con certificados, y rezar para que el firewall de la oficina no bloqueara nada. Hoy abres una pestaña del navegador y ya tienes tu extensión funcionando. Eso es WebRTC, y ha cambiado las reglas del juego en VoIP.

Qué es WebRTC y por qué importa

WebRTC (Web Real-Time Communication) es un estándar abierto que permite comunicaciones de audio y vídeo directamente desde el navegador, sin plugins ni instalaciones. Chrome, Firefox, Safari, Edge — todos lo soportan de forma nativa desde hace años.

Para los que venimos del mundo SIP, WebRTC fue una revolución silenciosa. De repente, el navegador se convirtió en un endpoint SIP legítimo. Ya no necesitabas convencer al departamento de IT para que instalara software en cada equipo. Ya no había problemas de compatibilidad con versiones de sistema operativo. El navegador ya estaba ahí.

Cómo funciona por debajo

Aquí es donde se pone interesante para los técnicos. WebRTC no habla SIP directamente. Usa su propio protocolo de señalización (normalmente sobre WebSocket) y encapsula el media en DTLS-SRTP obligatorio. Sí, obligatorio — no hay opción de audio sin cifrar en WebRTC. Esto ya es una mejora de seguridad enorme respecto al RTP pelado que muchos seguimos usando internamente.

La negociación de codecs en WebRTC es otro mundo respecto al SIP clásico. El codec por defecto es Opus, que es objetivamente superior a G.711 en casi todo: mejor calidad a menor ancho de banda, soporte para banda ancha (hasta 48kHz), y adaptación dinámica al ancho de banda disponible. Cada vez que configuro un trunk G.711 por restricciones del operador, una parte de mí muere un poco por dentro.

La conexión entre el mundo WebRTC y el mundo SIP requiere un gateway. En nuestro caso, ese gateway forma parte de la infraestructura de BPhone. Cuando un usuario abre el softphone web, se establece una conexión WebSocket con nuestro servidor, se negocia una sesión DTLS-SRTP, y el gateway se encarga de traducir la señalización a SIP y transcodificar el audio de Opus a G.711 (o viceversa) cuando la llamada sale a la red telefónica.

El problema del NAT (otra vez)

Si hay un tema recurrente en mi carrera, es el NAT. Y WebRTC no se libra, pero lo maneja mucho mejor que SIP clásico. El framework ICE (Interactive Connectivity Establishment) prueba automáticamente múltiples caminos para establecer la conexión: directo, STUN (descubrir la IP pública), y TURN (relay a través de un servidor intermedio) como último recurso.

En la práctica, el 80-85% de las conexiones se establecen directamente o vía STUN. El TURN es necesario sobre todo en redes corporativas con firewalls muy restrictivos. Nosotros mantenemos servidores TURN distribuidos para garantizar que el softphone funcione incluso en las redes más paranoicas. Es un coste operativo que asumimos porque la alternativa — que un usuario no pueda llamar desde la oficina de un cliente — no es aceptable.

Ventajas prácticas que noto cada día

  • Despliegue instantáneo: nuevo empleado, le mandas una URL, ya tiene extensión.
  • Movilidad real: funciona igual en la oficina, en casa, en el aeropuerto.
  • Cifrado por defecto: sin configurar nada, todas las comunicaciones van cifradas.
  • Calidad de audio superior: Opus a 48kHz suena notablemente mejor que G.711.
  • Integración con el entorno web: click-to-call en tu CRM, notificaciones del navegador, compartir pantalla…

Limitaciones honestas

No todo es perfecto. El softphone web depende del navegador, y los navegadores tienen sus manías. Chrome, por ejemplo, suspende las pestañas inactivas para ahorrar recursos, lo que puede hacer que pierdas llamadas entrantes si no tienes la pestaña en foco. Hemos tenido que implementar service workers y la Push API para mantener la conexión viva incluso con la pestaña en segundo plano.

La calidad de los auriculares y micrófonos integrados en portátiles sigue siendo mediocre. Siempre recomiendo unos cascos con cancelación de ruido decente. La mejor infraestructura WebRTC del mundo no compensa un micrófono malo.

Y para entornos con muchas llamadas simultáneas en un mismo ordenador (contact centers, por ejemplo), el consumo de CPU del navegador puede ser un factor. En esos casos, un softphone nativo todavía tiene ventajas.

Tu extensión, en cualquier navegador

El softphone WebRTC de BPhone funciona en Chrome, Firefox, Safari y Edge. Sin instalaciones, sin configuraciones, con cifrado de serie.

Prueba BPhone gratis →

Antonio Gutiérrez — Desarrollador e ingeniero informático en Baxilio

A

Antonio Gutiérrez

Desarrollador e ingeniero informático con más de 10 años de experiencia en telecomunicaciones y 8 años especializado en VoIP. Experto en desarrollo de plataformas SaaS, ha trabajado para Bayma y otros operadores de telecomunicaciones. En Baxilio lidera el desarrollo técnico de la plataforma de voz IA.

Scroll to Top