Integraciones · Voz IA
Cómo integrar tu CRM con un agente de voz IA
23 de mayo de 2026 · 8 min de lectura
Un agente de voz IA que solo habla es un contestador automático con esteroides. Lo que realmente transforma la atención telefónica es cuando el agente puede hacer cosas: consultar el estado de un pedido, agendar una cita, actualizar datos del cliente, escalar un ticket. Y para eso necesita hablar con tus sistemas. Aquí es donde entra la integración con el CRM.
Llevo los últimos dos años diseñando y construyendo el sistema de integraciones de Baxilio Voice, y quiero compartir cómo hemos abordado esto técnicamente. No es trivial, pero tampoco es ciencia espacial.
El concepto: tool calling en tiempo real
Los modelos de IA modernos tienen una capacidad llamada «tool calling» o «function calling». En vez de solo generar texto (o audio), pueden decidir durante la conversación que necesitan ejecutar una acción: «necesito buscar el pedido número 4521 en el sistema». El modelo genera una llamada estructurada a una función y espera el resultado antes de continuar hablando.
Aplicado a voz IA en telefonía, esto significa que en medio de una conversación, el agente puede:
- Detectar que necesita información que no tiene.
- Llamar a una API externa (tu CRM, tu ERP, tu sistema de tickets).
- Recibir la respuesta.
- Incorporarla a la conversación de forma natural.
Y todo esto tiene que pasar en tiempo real, durante una llamada telefónica. El usuario no puede estar esperando 10 segundos mientras el agente consulta tu base de datos.
Arquitectura: webhooks y tools
En Baxilio, la integración funciona con dos mecanismos complementarios:
Tools (herramientas del agente)
Defines un conjunto de herramientas que el agente puede usar. Cada herramienta tiene un nombre, una descripción (que el modelo usa para decidir cuándo invocarla), unos parámetros de entrada, y un endpoint HTTP al que llamar.
Por ejemplo, puedes definir una herramienta «consultar_estado_pedido» que recibe un número de pedido, llama a tu API REST, y devuelve el estado. El agente, durante la conversación, decide cuándo usarla basándose en lo que dice el cliente.
El diseño de las descripciones de las herramientas es más importante de lo que parece. Una descripción ambigua hace que el modelo invoque la herramienta cuando no debe, o que no la invoque cuando debería. En nuestras pruebas piloto, dedicamos bastante tiempo a refinar estas descripciones hasta conseguir una tasa de invocación precisa.
Webhooks (notificaciones asíncronas)
Los webhooks son el otro sentido de la comunicación. Baxilio envía eventos HTTP a tu sistema cuando ocurren cosas relevantes: llamada entrante (con el número del llamante, para que busques al cliente en tu CRM antes de que el agente conteste), llamada finalizada (con la transcripción y el resumen), cita agendada, etc.
La diferencia clave: las tools se ejecutan durante la llamada y afectan la conversación. Los webhooks notifican después (o antes) y sirven para sincronizar datos.
El reto de la latencia
Este es el problema técnico más gordo. Cuando el agente decide llamar a una tool, tiene que esperar la respuesta. Si tu API tarda 3 segundos en responder, son 3 segundos de silencio en la llamada. Y 3 segundos de silencio en una conversación telefónica son una eternidad.
Nuestras soluciones:
- Filler conversacional: mientras espera la respuesta, el agente dice algo como «un momento, estoy consultando su pedido…» Es una técnica simple pero efectiva. El usuario sabe que algo está pasando.
- Timeouts agresivos: si tu API no responde en 5 segundos, el agente lo comunica y ofrece una alternativa («no estoy pudiendo acceder al sistema en este momento, ¿puedo tomar nota y que le devolvamos la llamada?»).
- Caché inteligente: para datos que no cambian frecuentemente (catálogo de productos, horarios, políticas), cacheamos las respuestas para no tener que consultar cada vez.
- Prefetch con webhook de llamada entrante: cuando detectamos una llamada entrante, antes de que el agente conteste, ya estamos consultando el CRM con el número del llamante. Para cuando el agente necesita los datos, ya los tiene.
Ejemplo real: agenda de citas
La integración más popular que tenemos es la agenda de citas. El flujo típico:
- Cliente llama: «Quiero pedir cita para la semana que viene.»
- Agente invoca tool consultar_disponibilidad con parámetros de fecha.
- Tu sistema devuelve los huecos disponibles.
- Agente: «Tengo disponibilidad el martes a las 10 o el miércoles a las 16. ¿Cuál le viene mejor?»
- Cliente elige.
- Agente invoca tool crear_cita con la fecha, hora y datos del cliente.
- Tu sistema confirma la reserva.
- Agente: «Perfecto, queda agendada su cita para el martes 27 a las 10 de la mañana. Recibirá un SMS de confirmación.»
- Webhook dispara el envío del SMS desde tu sistema.
Todo esto ocurre en una conversación que suena completamente natural. El cliente no percibe que está hablando con una IA que está haciendo llamadas HTTP por detrás.
Lo que necesitas de tu lado
Para que la integración funcione, tu sistema necesita exponer una API REST o GraphQL con los endpoints necesarios. No necesita ser sofisticado — endpoints simples que devuelvan JSON son suficientes.
Lo que sí necesitas cuidar:
- Latencia baja: tus endpoints deberían responder en menos de 2 segundos. Idealmente menos de 500ms.
- Autenticación: API keys o OAuth. Nosotros almacenamos las credenciales cifradas.
- Idempotencia: si la petición se reintenta (por timeout de red, por ejemplo), el resultado debería ser el mismo. No quieres crear dos citas porque hubo un retry.
- Respuestas claras: JSON estructurado con mensajes de error descriptivos. El agente usa estos mensajes para informar al usuario.
Si no tienes API, no todo está perdido. Hemos integrado con Google Sheets, con calendarios de Google, y con sistemas que solo tenían formularios web (usando scraping con consentimiento del cliente, no es lo ideal pero funciona). En Baxilio también ofrecemos nuestra propia agenda integrada para los que no quieren complicarse.
Conecta tu CRM con tu agente de voz
Baxilio Voice se integra con tu CRM, tu agenda y tus sistemas internos. El agente consulta, agenda y actualiza datos durante la llamada.
Ver integraciones →Antonio Gutiérrez — Desarrollador e ingeniero informático en Baxilio
Antonio Gutiérrez
Desarrollador e ingeniero informático con más de 10 años de experiencia en telecomunicaciones y 8 años especializado en VoIP. Experto en desarrollo de plataformas SaaS, ha trabajado para Bayma y otros operadores de telecomunicaciones. En Baxilio lidera el desarrollo técnico de la plataforma de voz IA.