
Base de conocimiento para tu agente de IA en WhatsApp: cómo estructurarla para que responda bien
La calidad de las respuestas de tu chatbot depende directamente de la información que le das. Esta guía explica cómo organizar y mantener esa base de conocimiento para que el chatbot responda con precisión, sin inventarse nada y sin quedarse desfasado.
Base de conocimiento para tu agente de IA en WhatsApp: cómo estructurarla para que responda bien
La base de conocimiento es el conjunto de información que le das al agente de IA para que pueda responder las preguntas de tus clientes. La calidad de esa información determina directamente la calidad de las respuestas: un agente con una base de conocimiento bien estructurada responde con precisión; uno con una base mal organizada alucina, contradice o da respuestas genéricas que no aportan valor.
Esta guía explica cómo estructurar la base de conocimiento de tu agente, qué formato funciona mejor, cómo mantenerla actualizada y qué tipo de información no debe estar en ella.
Qué es la base de conocimiento y para qué sirve
La base de conocimiento (o knowledge center) es el repositorio de información estática o semiesática que el agente consulta para responder preguntas. A diferencia de los datos en tiempo real (stock, pedidos, agenda), la base de conocimiento contiene información que cambia poco y que el agente puede tener disponible sin consultar sistemas externos:
- Descripción de servicios y productos
- Precios y condiciones
- Políticas (devolución, cancelación, garantía)
- Horarios y datos de contacto
- Preguntas frecuentes (FAQ)
- Procesos estándar ("¿cómo me registro?", "¿cómo hago un pedido?")
- Información sobre el equipo o los profesionales
- Requisitos o documentación necesaria para cada servicio
Cómo funciona la base de conocimiento en un agente RAG
La mayoría de los agentes de IA modernos usan RAG (Retrieval-Augmented Generation): en lugar de tener toda la base de conocimiento en el prompt (lo que sería ineficiente e imposible de mantener), el agente recupera los fragmentos relevantes para cada pregunta y los usa como contexto para generar la respuesta.
El flujo es:
Pregunta del cliente
↓
El agente convierte la pregunta en un vector de búsqueda
↓
Busca los fragmentos más relevantes en la base de conocimiento (búsqueda semántica)
↓
Usa esos fragmentos + la pregunta original para generar la respuesta
↓
Responde al cliente
El resultado es que el agente puede manejar bases de conocimiento de cientos o miles de páginas sin que la velocidad de respuesta se vea afectada — y sin que el agente "invente" información que no está en los documentos.
Formato recomendado para los documentos de la base de conocimiento
Lo que funciona bien
Markdown estructurado con headings claros:
## Política de devoluciones
Los productos pueden devolverse en un plazo de 30 días desde la recepción.
El producto debe estar sin usar y con el embalaje original.
### Proceso de devolución
1. Contacta con nuestro equipo por WhatsApp o email.
2. Indica el número de pedido y el motivo de la devolución.
3. Recibirás una etiqueta de devolución en 24 horas.
4. El reembolso se procesa en 5-7 días hábiles tras recibir el producto.
### Excepciones
No se aceptan devoluciones de:
- Productos personalizados o a medida.
- Productos de higiene o alimentación abiertos.
- Contenido digital descargado.
Por qué funciona: los headings ayudan al sistema RAG a identificar de qué trata cada fragmento. El texto es directo, en primera persona del negocio, sin ambigüedades.
Preguntas y respuestas explícitas:
## ¿Cuánto tiempo tarda el envío?
El envío estándar tarda entre 3 y 5 días hábiles en la Península.
En Baleares, 5-7 días hábiles. En Canarias, 7-10 días hábiles.
Los pedidos realizados antes de las 13:00 salen el mismo día.
Los realizados después de las 13:00 salen al día laborable siguiente.
Por qué funciona: el agente recupera este fragmento exacto cuando el cliente pregunta por tiempos de envío, y puede dar la respuesta sin interpretación adicional.
Lo que no funciona bien
Documentos de Word o PDF mal estructurados: texto corrido sin headings, con tablas complejas, headers y footers de página, o columnas múltiples. El procesamiento pierde el contexto.
PDFs de imágenes escaneadas: el sistema RAG no puede leer texto en imágenes sin OCR previo.
Información contradictoria: si tienes "los envíos tardan 3 días" en un documento y "los envíos tardan 5 días" en otro, el agente puede dar cualquiera de las dos respuestas. Siempre debe haber una única fuente de verdad.
Información sin fecha o sin contexto de vigencia: "la oferta de lanzamiento es de X€" sin indicar si sigue activa genera respuestas incorrectas. Mejor eliminar la información obsoleta que dejarla como ruido.
Estructura recomendada del knowledge center
Organiza la base de conocimiento en secciones temáticas. Una estructura típica para una pyme de servicios:
📁 Knowledge Center
├── 01_negocio
│ ├── quienes-somos.md
│ ├── horarios-y-contacto.md
│ └── equipo.md
├── 02_servicios
│ ├── servicio-a-descripcion.md
│ ├── servicio-b-descripcion.md
│ └── tarifas-y-precios.md
├── 03_proceso
│ ├── como-funciona-primer-contacto.md
│ ├── como-hacer-un-pedido.md
│ └── seguimiento-de-pedido.md
├── 04_politicas
│ ├── devoluciones-y-garantias.md
│ ├── politica-de-privacidad-resumen.md
│ └── cancelaciones.md
└── 05_faq
├── preguntas-generales.md
├── preguntas-tecnicos.md
└── preguntas-pagos.md
Mantenimiento de la base de conocimiento
Cuándo actualizar
- Cuando cambias precios, tarifas o condiciones: actualiza el documento antes de que el cambio entre en vigor.
- Cuando lanzas un producto o servicio nuevo: añade la ficha correspondiente.
- Cuando el agente da una respuesta incorrecta repetidamente: revisa si la información en la base es ambigua o incorrecta.
- Cuando cambias la política de devoluciones, horarios o cualquier dato operativo: un dato desactualizado en la base de conocimiento es una queja esperando suceder.
Proceso de actualización recomendado
- Identifica el documento afectado.
- Edita el contenido (mantén el formato Markdown y los headings).
- Sube la nueva versión a Nexus (la re-indexación es automática y tarda menos de 2 minutos).
- Prueba con 2-3 preguntas relacionadas para verificar que el agente responde correctamente.
Indicadores de que la base de conocimiento necesita revisión
- El agente da respuestas vaguas o genéricas donde antes era específico.
- Los clientes hacen la misma pregunta y el agente no la responde correctamente de forma consistente.
- Aumenta el número de handovers por "no sé responder a esto".
- El equipo recibe más preguntas repetitivas por otros canales (email, teléfono) que deberían estar cubiertas por el agente.
Qué NO debe estar en la base de conocimiento
| Tipo de información | Por qué no | Alternativa |
|---|---|---|
| Stock en tiempo real | Cambia constantemente; en la base de conocimiento quedaría obsoleta en horas | Integración directa con el ERP o plataforma de ecommerce |
| Estado de pedidos concretos | Es información individual y dinámica | Consulta a la API del sistema de gestión de pedidos |
| Disponibilidad de agenda | Cambia continuamente | Integración con el sistema de calendario |
| Precios de oferta con fecha de fin | Si la fecha pasa, el agente seguirá diciendo el precio de oferta | Gestionar con variables dinámicas o eliminar de la base al terminar la oferta |
| Información confidencial interna | Costes, márgenes, datos de empleados, datos de clientes | Nunca en la base de conocimiento del agente |
Preguntas frecuentes
¿Cuántos documentos puede tener la base de conocimiento?
No hay un límite técnico práctico para negocios de tamaño pyme. Bases de conocimiento de hasta 500 páginas de texto bien estructurado funcionan correctamente con RAG. El rendimiento de la búsqueda no se degrada significativamente con el volumen si los documentos están bien organizados.
¿En qué idioma deben estar los documentos?
En el mismo idioma en el que el agente va a responder. Si el agente responde en español, los documentos deben estar en español. Si atiendes en varios idiomas, puedes tener versiones en cada idioma o usar un sistema de traducción dinámica (menos preciso pero más mantenible).
¿Puedo subir PDFs directamente?
Sí, si los PDFs tienen texto seleccionable (no son imágenes escaneadas). Sin embargo, el Markdown sigue siendo el formato más limpio y con mejor rendimiento en RAG. Si tienes PDFs, considera convertirlos a Markdown antes de subirlos.
¿Qué pasa si el agente no encuentra la respuesta en la base de conocimiento?
El agente está configurado para reconocer cuando no tiene información suficiente y responder con honestidad: "No tengo esa información disponible ahora mismo. Te pongo en contacto con alguien del equipo para que te ayude." Es mejor admitir que no se sabe que inventar una respuesta.
¿Puedo tener información diferente para clientes y para prospectos?
Sí. Puedes segmentar la base de conocimiento por tipo de usuario y el agente solo accede a la sección correspondiente según el perfil del interlocutor. Por ejemplo: los clientes existentes ven información de soporte y cuenta; los prospectos ven información de servicios y precios.
Conclusión
Una base de conocimiento bien estructurada es la diferencia entre un agente que da respuestas precisas y genera confianza, y uno que alucina, se contradice o deriva todo a humano. La inversión en estructurar bien el knowledge center al principio — y en mantenerlo actualizado — se recupera rápidamente en la calidad de las respuestas y en la reducción de handovers innecesarios.
¿Necesitas ayuda para estructurar la base de conocimiento de tu negocio? Contáctanos y lo preparamos juntos antes de configurar el agente.
Artículos relacionados

Cómo tu chatbot de WhatsApp puede escribir primero a tus clientes (y cuándo hacerlo)
8 min
Agente de IA por horarios en WhatsApp: cómo activar y desactivar el bot según tu jornada laboral
7 min
Qué sabe tu chatbot por sí solo y qué tiene que consultar en tiempo real: la diferencia que cambia todo
9 min¿Listo para empezar?
Únete a la lista de espera y sé de los primeros en experimentar el futuro de la automatización con IA.
Únete a la lista de espera