Explicado · Voz IA

Base de conocimiento RAG: cómo el agente IA aprende tu negocio

Q: La solución: buscar primero, responder después

RAG funciona así, simplificando: Preparación (una vez): coges toda la documentación de tu negocio — FAQs, catálogos, políticas, procedimientos — y la "troceamos" en fragmentos manejables. Cada fragmento se convierte en un vector numérico (un embedding) que captura su significado semántic

25 de abril de 2026 · 7 min de lectura

Una de las preguntas que más recibo cuando hablo con empresas interesadas en Baxilio Voice es: «vale, el agente habla bien, pero ¿cómo va a saber las cosas específicas de mi negocio?». Es una pregunta perfectamente razonable. Y la respuesta es RAG.

No, no es un acrónimo siniestro. Retrieval-Augmented Generation. Y es probablemente la pieza más importante de todo el puzzle de la voz IA aplicada a empresas. Voy a explicarlo como me hubiera gustado que me lo explicaran a mí la primera vez.

El problema: la IA sabe mucho, pero no sabe lo tuyo

Los modelos de lenguaje grandes (LLMs) se han entrenado con cantidades absurdas de texto de internet. Saben de historia, de ciencia, de programación, de cocina. Pero no saben cuáles son los horarios de tu clínica dental, ni qué servicios ofrece tu taller mecánico, ni cuál es la política de devoluciones de tu tienda online.

Podrías meter toda esa información en el prompt del sistema, pero los prompts tienen límite. Y aunque no lo tuvieran, mandar 200 páginas de documentación en cada llamada sería lento y carísimo.

La solución: buscar primero, responder después

RAG funciona así, simplificando:

Preparación (una vez): coges toda la documentación de tu negocio — FAQs, catálogos, políticas, procedimientos — y la «troceamos» en fragmentos manejables. Cada fragmento se convierte en un vector numérico (un embedding) que captura su significado semántico. Estos vectores se almacenan en una base de datos vectorial.
Consulta (cada vez que alguien pregunta): cuando un cliente llama y pregunta algo, convertimos su pregunta en un vector y buscamos los fragmentos más similares semánticamente. No es una búsqueda por palabras clave — es una búsqueda por significado.
Respuesta: le pasamos al modelo de IA los fragmentos relevantes junto con la pregunta del usuario. El modelo genera una respuesta basada en esa información específica, no en su conocimiento general.

Es como la diferencia entre preguntarle algo a alguien que «sabe de todo un poco» versus darle primero un dossier con la información relevante y luego preguntarle. La segunda opción da respuestas mucho más precisas y fiables.

Los embeddings, explicados sin matemáticas

Los embeddings son el truco que hace que todo funcione. Imagina que cada frase se convierte en un punto en un espacio de muchas dimensiones (cientos o miles). Las frases con significados similares acaban como puntos cercanos entre sí.

«¿Cuáles son vuestros horarios?» y «A qué hora abrís?» son frases con palabras diferentes pero significado casi idéntico. Sus vectores estarán muy cerca. «¿Cuánto cuesta el servicio premium?» estará lejos de ambas, pero cerca de «¿Qué precio tiene el plan avanzado?».

Esto permite que el sistema encuentre la información relevante aunque el cliente use palabras completamente diferentes a las que aparecen en tu documentación. Es una diferencia enorme respecto a los bots basados en keywords que muchos hemos sufrido (y desarrollado, mea culpa).

Cómo lo hemos construido en Baxilio

Durante el desarrollo de nuestro sistema de knowledge base, probamos varios enfoques antes de llegar al que tenemos hoy:

El chunking importa más de lo que parece. Cortar los documentos en fragmentos demasiado pequeños pierde contexto. Demasiado grandes y el embedding se vuelve difuso. Después de bastantes pruebas, encontramos que fragmentos de 300-500 tokens con un solapamiento del 15-20% dan los mejores resultados para documentación empresarial en español. Otros idiomas pueden tener puntos óptimos diferentes.

La base de datos vectorial. Usamos PostgreSQL con la extensión pgvector. Sí, podríamos usar Pinecone o Weaviate, pero ya teníamos PostgreSQL para todo lo demás y pgvector es sorprendentemente bueno para nuestro volumen. Menos infraestructura que mantener, menos puntos de fallo. Cuando tienes experiencia operando sistemas en producción, valoras la simplicidad.

El re-ranking. La búsqueda vectorial no es perfecta. A veces sube resultados que son semánticamente cercanos pero no realmente útiles. Por eso añadimos una segunda pasada de re-ranking que evalúa la relevancia real de cada fragmento respecto a la pregunta. Añade unos milisegundos de latencia pero mejora notablemente la precisión.

Lo que sube el usuario, en la práctica

En Baxilio hemos intentado que subir tu conocimiento sea lo más simple posible. Puedes pegar texto directamente, subir PDFs, o apuntar a una URL y nuestro sistema extrae el contenido. Automáticamente se trocea, se generan los embeddings, y está disponible para el agente.

No voy a mentir: la calidad de las respuestas del agente depende directamente de la calidad de la documentación que le des. «Basura entra, basura sale» aplica aquí al 100%. Un documento bien escrito, con preguntas y respuestas claras, produce un agente que suena competente y seguro. Un PDF escaneado de un manual de 1997 produce… bueno, ya te imaginas.

Las limitaciones que deberías conocer

RAG no es magia. El agente no «entiende» tu negocio — recupera información relevante y la usa para formular respuestas. Si la información no está en la base de conocimiento, el agente debería decir que no lo sabe (y así lo configuramos), no inventarse la respuesta.

También hay límites en la complejidad de las consultas. Si un cliente hace una pregunta que requiere cruzar información de cinco documentos diferentes y hacer deducciones, el sistema puede no dar una respuesta perfecta. Para esos casos, la configuración de escalado a un agente humano es fundamental.

Pero para el 70-80% de las preguntas repetitivas que recibe cualquier negocio — horarios, precios, disponibilidad, políticas — RAG funciona extraordinariamente bien.

Dale conocimiento a tu agente de voz

Con Baxilio Voice, subir tu base de conocimiento es cuestión de minutos. El agente aprende tu negocio y empieza a responder llamadas con información precisa.

Configura tu agente IA →

Antonio Gutiérrez — Desarrollador e ingeniero informático en Baxilio

Antonio Gutiérrez

Desarrollador e ingeniero informático con más de 10 años de experiencia en telecomunicaciones y 8 años especializado en VoIP. Experto en desarrollo de plataformas SaaS, ha trabajado para Bayma y otros operadores de telecomunicaciones. En Baxilio lidera el desarrollo técnico de la plataforma de voz IA.

Te puede interesar

Cómo funciona la tecnología voice-to-voice: del audio al...

WhatsApp Business API: por qué decidimos no integrarla...

Text-to-speech en 2026: de voces robóticas a locuciones...