Qué sabe tu chatbot por sí solo y qué tiene que consultar en tiempo real: la diferencia que cambia todo

28 de enero de 20269 min de lecturaPor Diego, de Nexus

Tu chatbot puede responder desde la información que le has enseñado o consultando tus sistemas en el momento. No son lo mismo: uno sirve para preguntas generales, el otro para datos que cambian cada hora. Esta guía explica cuándo usar cada uno y cómo combinarlos.

Qué sabe tu chatbot por sí solo y qué tiene que consultar en tiempo real

Cuando un cliente pregunta "¿cuánto cuesta vuestro servicio?", el chatbot responde desde la información que le has enseñado — esos datos son estables y no cambian cada hora. Pero cuando pregunta "¿está disponible el producto X en talla M?", la respuesta depende del stock actual de tu almacén, que puede haber cambiado hace cinco minutos.

Estas dos situaciones representan los dos patrones principales de información en un agente de IA: RAG (Retrieval-Augmented Generation, para conocimiento estático o semiesático) y datos en tiempo real (para información dinámica consultada en sistemas externos en el momento de la pregunta).

Esta guía explica cómo funciona cada uno, para qué sirve, cuáles son sus limitaciones y cómo se combinan en un agente de producción.

RAG: qué es y cómo funciona

RAG (Retrieval-Augmented Generation) es una técnica por la que el agente, en lugar de tener toda la información en su prompt o "memorizada" en el modelo, recupera los fragmentos relevantes de una base de documentos indexados y los usa como contexto para generar la respuesta.

El flujo paso a paso

1. Cliente pregunta: "¿Cuánto tiempo tengo para devolver un producto?"

2. El agente convierte la pregunta en un vector numérico (embedding)

3. Busca en la base de conocimiento los fragmentos con mayor similitud semántica:
   → Recupera el párrafo de "Política de devoluciones" que explica el plazo de 30 días

4. Usa esos fragmentos como contexto para generar la respuesta:
   → "Tienes 30 días desde la fecha de recepción para devolver el producto..."

5. Responde al cliente con la información correcta

Qué tipo de información va en la base RAG

Descripciones de servicios y productos
Precios y tarifas (estables)
Políticas: devoluciones, garantías, privacidad, cancelaciones
Horarios y datos de contacto
Preguntas frecuentes
Procesos y flujos ("¿cómo me registro?", "¿cómo hago un pedido?")
Documentación técnica o de uso

Ventajas del RAG

Escala sin límite: la base de conocimiento puede tener cientos de páginas sin afectar el rendimiento.
Actualizaciones sencillas: cambias un documento y la re-indexación es automática en minutos.
El agente no inventa: si la información no está en la base, el agente lo reconoce y no alucina.
Sin dependencias externas en tiempo de respuesta: no necesita llamar a sistemas externos para responder.

Limitaciones del RAG

No sirve para información dinámica: si el precio cambia cada día o el stock varía cada hora, el RAG queda desactualizado rápidamente.
Calidad dependiente de la base: si los documentos están mal estructurados o contradicen entre sí, las respuestas serán inconsistentes.
No puede responder sobre estados individuales: el RAG no sabe dónde está el pedido de este cliente concreto — solo conoce información general.

Datos en tiempo real: qué son y cómo funcionan

Los datos en tiempo real son información que el agente obtiene consultando un sistema externo en el momento de la pregunta: el ERP, la plataforma de ecommerce, el CRM, la agenda de citas, el sistema de inventario.

El flujo paso a paso

1. Cliente pregunta: "¿Está disponible el modelo X en talla M?"

2. El agente identifica que necesita datos de inventario en tiempo real

3. Llama a la API del sistema de inventario:
   GET /api/products?model=X&size=M
   → Respuesta: { "available": 3, "warehouse": "Madrid" }

4. Usa esa respuesta para generar el mensaje al cliente:
   → "Sí, tenemos 3 unidades disponibles del modelo X en talla M, en nuestro
      almacén de Madrid. ¿Quieres que te reserve una?"

5. Responde al cliente con datos actualizados a este momento

Qué tipo de información requiere datos en tiempo real

Tipo de dato	Por qué en tiempo real	Sistema fuente
Stock de producto	Cambia con cada venta o recepción de mercancía	ERP / ecommerce
Estado de pedido	Cambia con cada actualización logística	ERP / plataforma de envíos
Disponibilidad en agenda	Cambia con cada reserva o cancelación	Google Calendar / Calendly
Precio con descuento activo	El descuento tiene fecha de fin	ERP / ecommerce
Estado de una incidencia	Cambia con el trabajo del equipo de soporte	Helpdesk / CRM
Saldo de una cuenta o bono	Cambia con cada uso	Sistema de gestión propio
Tiempo de espera en cola	Varía en tiempo real	Sistema de colas

Ventajas de los datos en tiempo real

Siempre actualizados: la respuesta refleja el estado actual del sistema, no el de la última actualización de la base de conocimiento.
Permite acciones, no solo consultas: el agente puede crear un pedido, reservar una cita o abrir un ticket — no solo leer información.
Personalización individual: el agente puede responder sobre el pedido de este cliente, no sobre los pedidos en general.

Limitaciones de los datos en tiempo real

Dependencia de disponibilidad externa: si el sistema externo está caído, el agente no puede responder esa consulta.
Latencia adicional: cada llamada a API añade tiempo de respuesta (típicamente 200ms–2s según el sistema).
Más complejidad de configuración: requiere integración técnica con cada sistema externo.
Manejo de errores: hay que diseñar qué hace el agente si la API devuelve error o datos inesperados.

Comparativa directa

Criterio	RAG	Tiempo real
Tipo de información	Estática / semiesática	Dinámica, cambia frecuentemente
Latencia de respuesta	Baja (< 500ms)	Media (500ms–3s, depende de la API)
Precisión	Alta si la base está bien mantenida	Alta si el sistema externo es fiable
Personalización por cliente	No (información general)	Sí (datos del cliente concreto)
Coste de mantenimiento	Bajo (actualizar documentos)	Medio–alto (mantener integraciones)
Puede ejecutar acciones	No	Sí (crear, modificar, eliminar registros)
Resiliente a fallos externos	Sí	No (depende del sistema externo)
Requiere integración técnica	No	Sí

Cómo se combinan en un agente de producción

En la práctica, los agentes de producción usan ambos según el tipo de pregunta. El agente decide qué fuente consultar en función de la intención detectada:

Pregunta recibida
      ↓
Clasificación de intención
      ↓
¿Es información general o política?  →  RAG
¿Es información del estado de un objeto o entidad concreta?  →  API tiempo real
¿Requiere tomar una acción?  →  API tiempo real (escritura)
¿Es ambigua?  →  Empieza por RAG, escala a tiempo real si hace falta

Ejemplo combinado: agencia de viajes

Pregunta del cliente	Fuente usada	Por qué
"¿Cuáles son vuestros destinos más populares?"	RAG	Información estable del catálogo
"¿El vuelo a Cancún el 15 de abril tiene plazas?"	Tiempo real	Disponibilidad de asientos, cambia constantemente
"¿Qué necesito para viajar a México sin visado?"	RAG	Información regulatoria, cambia raramente
"¿Mi reserva nº 12345 está confirmada?"	Tiempo real	Estado individual del cliente en el sistema
"¿Qué documentación necesito para el seguro de viaje?"	RAG	Política estándar de la aseguradora
"Quiero cambiar las fechas de mi reserva"	Tiempo real (escritura)	Acción en el sistema de reservas

Errores comunes al diseñar la estrategia de información

Error 1 — Poner información dinámica en la base RAG

"El precio del servicio A es 49 €/mes" en un documento RAG está bien si el precio no cambia. Pero si lanzas una promoción temporal que lo baja a 39 €, el agente seguirá diciendo 49 € hasta que actualices el documento. Para precios con promociones activas o vigencias cortas, usa datos en tiempo real o elimina la información del RAG mientras dure la promoción.

Error 2 — Llamar a APIs en tiempo real para información que no cambia

Consultar el ERP para saber "qué tipos de garantía ofrecéis" en cada conversación es innecesario. Esa información es estable, va bien en el RAG y no consume llamadas a la API.

Error 3 — No manejar los fallos de la API

Si el sistema externo está caído y el agente no tiene un fallback, la respuesta al cliente es silencio o error. Siempre diseña qué hace el agente cuando la API no responde: información parcial desde RAG si está disponible, mensaje honesto al cliente, handover al equipo.

Error 4 — Indexar información confidencial en el RAG

Los datos de clientes, costes internos, márgenes o información de empleados nunca deben estar en la base de conocimiento del agente. El RAG es la información que el agente puede compartir con cualquier cliente — trata cada fragmento indexado como potencialmente público.

Preguntas frecuentes

¿Puedo usar RAG con documentos que se actualizan solos desde una URL?

Sí. Nexus soporta fuentes RAG con actualización periódica desde URLs (por ejemplo, una página de precios en formato Markdown o un RSS de noticias). El sistema re-indexa automáticamente cuando detecta cambios en el contenido.

¿Cuántas APIs puede consultar el agente en una misma conversación?

No hay un límite fijo, pero cada llamada añade latencia. Para mantener los tiempos de respuesta aceptables (< 3 segundos por turno), se recomienda no más de 2-3 llamadas a API por turno de conversación. Para consultas complejas que requieren muchos datos, el agente puede pedir al cliente que espere unos segundos mientras recopila la información.

¿El agente puede cachear resultados de la API para no llamar en cada mensaje?

Sí, para datos que cambian poco (catálogo de productos, tarifas) se puede configurar un cache de corta duración (5-15 minutos). Para datos muy dinámicos (stock, colas) no se recomienda cache para evitar dar información incorrecta.

¿Qué pasa si la API devuelve datos en un formato inesperado?

El agente tiene lógica de validación para cada integración. Si la respuesta no tiene el formato esperado, el agente maneja el error gracefully: informa al cliente de que no puede recuperar esa información en este momento y ofrece alternativas (handover, callback, email).

Conclusión

RAG y datos en tiempo real no compiten — se complementan. El RAG da al agente el conocimiento general del negocio sin coste de latencia ni dependencias externas. Los datos en tiempo real dan al agente la capacidad de responder sobre situaciones concretas e individuales y de tomar acciones reales en los sistemas del negocio. Un agente de producción bien diseñado usa ambos de forma transparente para el cliente, que simplemente recibe la respuesta correcta sin saber de dónde vino.

¿Quieres revisar la arquitectura de información de tu agente? Solicita una sesión técnica y analizamos qué debe ir en el RAG y qué en tiempo real para tu caso concreto.

¿Listo para empezar?

Únete a la lista de espera y sé de los primeros en experimentar el futuro de la automatización con IA.

Únete a la lista de espera

Qué sabe tu chatbot por sí solo y qué tiene que consultar en tiempo real: la diferencia que cambia todo

Qué sabe tu chatbot por sí solo y qué tiene que consultar en tiempo real

RAG: qué es y cómo funciona

El flujo paso a paso

Qué tipo de información va en la base RAG

Ventajas del RAG

Limitaciones del RAG

Datos en tiempo real: qué son y cómo funcionan

El flujo paso a paso

Qué tipo de información requiere datos en tiempo real

Ventajas de los datos en tiempo real

Limitaciones de los datos en tiempo real

Comparativa directa

Cómo se combinan en un agente de producción

Ejemplo combinado: agencia de viajes

Errores comunes al diseñar la estrategia de información

Error 1 — Poner información dinámica en la base RAG

Error 2 — Llamar a APIs en tiempo real para información que no cambia

Error 3 — No manejar los fallos de la API

Error 4 — Indexar información confidencial en el RAG

Preguntas frecuentes

¿Puedo usar RAG con documentos que se actualizan solos desde una URL?

¿Cuántas APIs puede consultar el agente en una misma conversación?

¿El agente puede cachear resultados de la API para no llamar en cada mensaje?

¿Qué pasa si la API devuelve datos en un formato inesperado?

Conclusión

Artículos relacionados

WhatsApp Business gratuito vs WhatsApp Business API: cuál necesita tu empresa y por qué

Chatbot vs agente de IA para WhatsApp: cuál necesita tu negocio

Base de conocimiento para tu agente de IA en WhatsApp: cómo estructurarla para que responda bien

¿Listo para empezar?