
Qué sabe tu chatbot por sí solo y qué tiene que consultar en tiempo real: la diferencia que cambia todo
Tu chatbot puede responder desde la información que le has enseñado o consultando tus sistemas en el momento. No son lo mismo: uno sirve para preguntas generales, el otro para datos que cambian cada hora. Esta guía explica cuándo usar cada uno y cómo combinarlos.
Qué sabe tu chatbot por sí solo y qué tiene que consultar en tiempo real
Cuando un cliente pregunta "¿cuánto cuesta vuestro servicio?", el chatbot responde desde la información que le has enseñado — esos datos son estables y no cambian cada hora. Pero cuando pregunta "¿está disponible el producto X en talla M?", la respuesta depende del stock actual de tu almacén, que puede haber cambiado hace cinco minutos.
Estas dos situaciones representan los dos patrones principales de información en un agente de IA: RAG (Retrieval-Augmented Generation, para conocimiento estático o semiesático) y datos en tiempo real (para información dinámica consultada en sistemas externos en el momento de la pregunta).
Esta guía explica cómo funciona cada uno, para qué sirve, cuáles son sus limitaciones y cómo se combinan en un agente de producción.
RAG: qué es y cómo funciona
RAG (Retrieval-Augmented Generation) es una técnica por la que el agente, en lugar de tener toda la información en su prompt o "memorizada" en el modelo, recupera los fragmentos relevantes de una base de documentos indexados y los usa como contexto para generar la respuesta.
El flujo paso a paso
1. Cliente pregunta: "¿Cuánto tiempo tengo para devolver un producto?"
2. El agente convierte la pregunta en un vector numérico (embedding)
3. Busca en la base de conocimiento los fragmentos con mayor similitud semántica:
→ Recupera el párrafo de "Política de devoluciones" que explica el plazo de 30 días
4. Usa esos fragmentos como contexto para generar la respuesta:
→ "Tienes 30 días desde la fecha de recepción para devolver el producto..."
5. Responde al cliente con la información correcta
Qué tipo de información va en la base RAG
- Descripciones de servicios y productos
- Precios y tarifas (estables)
- Políticas: devoluciones, garantías, privacidad, cancelaciones
- Horarios y datos de contacto
- Preguntas frecuentes
- Procesos y flujos ("¿cómo me registro?", "¿cómo hago un pedido?")
- Documentación técnica o de uso
Ventajas del RAG
- Escala sin límite: la base de conocimiento puede tener cientos de páginas sin afectar el rendimiento.
- Actualizaciones sencillas: cambias un documento y la re-indexación es automática en minutos.
- El agente no inventa: si la información no está en la base, el agente lo reconoce y no alucina.
- Sin dependencias externas en tiempo de respuesta: no necesita llamar a sistemas externos para responder.
Limitaciones del RAG
- No sirve para información dinámica: si el precio cambia cada día o el stock varía cada hora, el RAG queda desactualizado rápidamente.
- Calidad dependiente de la base: si los documentos están mal estructurados o contradicen entre sí, las respuestas serán inconsistentes.
- No puede responder sobre estados individuales: el RAG no sabe dónde está el pedido de este cliente concreto — solo conoce información general.
Datos en tiempo real: qué son y cómo funcionan
Los datos en tiempo real son información que el agente obtiene consultando un sistema externo en el momento de la pregunta: el ERP, la plataforma de ecommerce, el CRM, la agenda de citas, el sistema de inventario.
El flujo paso a paso
1. Cliente pregunta: "¿Está disponible el modelo X en talla M?"
2. El agente identifica que necesita datos de inventario en tiempo real
3. Llama a la API del sistema de inventario:
GET /api/products?model=X&size=M
→ Respuesta: { "available": 3, "warehouse": "Madrid" }
4. Usa esa respuesta para generar el mensaje al cliente:
→ "Sí, tenemos 3 unidades disponibles del modelo X en talla M, en nuestro
almacén de Madrid. ¿Quieres que te reserve una?"
5. Responde al cliente con datos actualizados a este momento
Qué tipo de información requiere datos en tiempo real
| Tipo de dato | Por qué en tiempo real | Sistema fuente |
|---|---|---|
| Stock de producto | Cambia con cada venta o recepción de mercancía | ERP / ecommerce |
| Estado de pedido | Cambia con cada actualización logística | ERP / plataforma de envíos |
| Disponibilidad en agenda | Cambia con cada reserva o cancelación | Google Calendar / Calendly |
| Precio con descuento activo | El descuento tiene fecha de fin | ERP / ecommerce |
| Estado de una incidencia | Cambia con el trabajo del equipo de soporte | Helpdesk / CRM |
| Saldo de una cuenta o bono | Cambia con cada uso | Sistema de gestión propio |
| Tiempo de espera en cola | Varía en tiempo real | Sistema de colas |
Ventajas de los datos en tiempo real
- Siempre actualizados: la respuesta refleja el estado actual del sistema, no el de la última actualización de la base de conocimiento.
- Permite acciones, no solo consultas: el agente puede crear un pedido, reservar una cita o abrir un ticket — no solo leer información.
- Personalización individual: el agente puede responder sobre el pedido de este cliente, no sobre los pedidos en general.
Limitaciones de los datos en tiempo real
- Dependencia de disponibilidad externa: si el sistema externo está caído, el agente no puede responder esa consulta.
- Latencia adicional: cada llamada a API añade tiempo de respuesta (típicamente 200ms–2s según el sistema).
- Más complejidad de configuración: requiere integración técnica con cada sistema externo.
- Manejo de errores: hay que diseñar qué hace el agente si la API devuelve error o datos inesperados.
Comparativa directa
| Criterio | RAG | Tiempo real |
|---|---|---|
| Tipo de información | Estática / semiesática | Dinámica, cambia frecuentemente |
| Latencia de respuesta | Baja (< 500ms) | Media (500ms–3s, depende de la API) |
| Precisión | Alta si la base está bien mantenida | Alta si el sistema externo es fiable |
| Personalización por cliente | No (información general) | Sí (datos del cliente concreto) |
| Coste de mantenimiento | Bajo (actualizar documentos) | Medio–alto (mantener integraciones) |
| Puede ejecutar acciones | No | Sí (crear, modificar, eliminar registros) |
| Resiliente a fallos externos | Sí | No (depende del sistema externo) |
| Requiere integración técnica | No | Sí |
Cómo se combinan en un agente de producción
En la práctica, los agentes de producción usan ambos según el tipo de pregunta. El agente decide qué fuente consultar en función de la intención detectada:
Pregunta recibida
↓
Clasificación de intención
↓
¿Es información general o política? → RAG
¿Es información del estado de un objeto o entidad concreta? → API tiempo real
¿Requiere tomar una acción? → API tiempo real (escritura)
¿Es ambigua? → Empieza por RAG, escala a tiempo real si hace falta
Ejemplo combinado: agencia de viajes
| Pregunta del cliente | Fuente usada | Por qué |
|---|---|---|
| "¿Cuáles son vuestros destinos más populares?" | RAG | Información estable del catálogo |
| "¿El vuelo a Cancún el 15 de abril tiene plazas?" | Tiempo real | Disponibilidad de asientos, cambia constantemente |
| "¿Qué necesito para viajar a México sin visado?" | RAG | Información regulatoria, cambia raramente |
| "¿Mi reserva nº 12345 está confirmada?" | Tiempo real | Estado individual del cliente en el sistema |
| "¿Qué documentación necesito para el seguro de viaje?" | RAG | Política estándar de la aseguradora |
| "Quiero cambiar las fechas de mi reserva" | Tiempo real (escritura) | Acción en el sistema de reservas |
Errores comunes al diseñar la estrategia de información
Error 1 — Poner información dinámica en la base RAG
"El precio del servicio A es 49 €/mes" en un documento RAG está bien si el precio no cambia. Pero si lanzas una promoción temporal que lo baja a 39 €, el agente seguirá diciendo 49 € hasta que actualices el documento. Para precios con promociones activas o vigencias cortas, usa datos en tiempo real o elimina la información del RAG mientras dure la promoción.
Error 2 — Llamar a APIs en tiempo real para información que no cambia
Consultar el ERP para saber "qué tipos de garantía ofrecéis" en cada conversación es innecesario. Esa información es estable, va bien en el RAG y no consume llamadas a la API.
Error 3 — No manejar los fallos de la API
Si el sistema externo está caído y el agente no tiene un fallback, la respuesta al cliente es silencio o error. Siempre diseña qué hace el agente cuando la API no responde: información parcial desde RAG si está disponible, mensaje honesto al cliente, handover al equipo.
Error 4 — Indexar información confidencial en el RAG
Los datos de clientes, costes internos, márgenes o información de empleados nunca deben estar en la base de conocimiento del agente. El RAG es la información que el agente puede compartir con cualquier cliente — trata cada fragmento indexado como potencialmente público.
Preguntas frecuentes
¿Puedo usar RAG con documentos que se actualizan solos desde una URL?
Sí. Nexus soporta fuentes RAG con actualización periódica desde URLs (por ejemplo, una página de precios en formato Markdown o un RSS de noticias). El sistema re-indexa automáticamente cuando detecta cambios en el contenido.
¿Cuántas APIs puede consultar el agente en una misma conversación?
No hay un límite fijo, pero cada llamada añade latencia. Para mantener los tiempos de respuesta aceptables (< 3 segundos por turno), se recomienda no más de 2-3 llamadas a API por turno de conversación. Para consultas complejas que requieren muchos datos, el agente puede pedir al cliente que espere unos segundos mientras recopila la información.
¿El agente puede cachear resultados de la API para no llamar en cada mensaje?
Sí, para datos que cambian poco (catálogo de productos, tarifas) se puede configurar un cache de corta duración (5-15 minutos). Para datos muy dinámicos (stock, colas) no se recomienda cache para evitar dar información incorrecta.
¿Qué pasa si la API devuelve datos en un formato inesperado?
El agente tiene lógica de validación para cada integración. Si la respuesta no tiene el formato esperado, el agente maneja el error gracefully: informa al cliente de que no puede recuperar esa información en este momento y ofrece alternativas (handover, callback, email).
Conclusión
RAG y datos en tiempo real no compiten — se complementan. El RAG da al agente el conocimiento general del negocio sin coste de latencia ni dependencias externas. Los datos en tiempo real dan al agente la capacidad de responder sobre situaciones concretas e individuales y de tomar acciones reales en los sistemas del negocio. Un agente de producción bien diseñado usa ambos de forma transparente para el cliente, que simplemente recibe la respuesta correcta sin saber de dónde vino.
¿Quieres revisar la arquitectura de información de tu agente? Solicita una sesión técnica y analizamos qué debe ir en el RAG y qué en tiempo real para tu caso concreto.
Artículos relacionados
¿Listo para empezar?
Únete a la lista de espera y sé de los primeros en experimentar el futuro de la automatización con IA.
Únete a la lista de espera

