Cómo funciona el entrenamiento

Los cuatro tipos de fuente, el flujo de status, el medidor de presupuesto de caracteres y la barra de acción que te dice qué hacer.

"Training" en ChatbotGen significa alimentar el chatbot con contenido para que pueda responder con precisión. La pestaña Training es donde pasa ese trabajo. Esta página es la vista panorámica — cada tipo de fuente tiene su propia guía.

Cuatro tipos de fuente

Cada chatbot puede tomar conocimiento de cuatro tipos. La página Training tiene una pestaña por tipo, cada una con un contador en vivo:

┌────────────────────────────────────────────────┐
│  Files (3)   URLs (12)   Q&A (8)   Text (2)    │
└────────────────────────────────────────────────┘

Files — subidas de PDF, DOCX, TXT. Ver Subir archivos.
URLs — páginas individuales o crawls de todo el sitio. Ver URLs de sitio web.
Q&A — pares de pregunta/respuesta escritos a mano con variaciones. Ver Preguntas y respuestas.
Text — fragmentos de texto pegados directo. (Guía dedicada próximamente — por ahora, ver la pestaña Text en tu chatbot.)

Las cuatro alimentan el mismo retriever. Al chatbot no le importa de dónde vino un dato — busca en todo.

Flujo de status

Cada fuente individual lleva su propio status:

Files: pending → processing → completed (o failed)
URLs: pending → crawling → completed (o failed)
Text: pending → processing → completed (o failed)
Q&A: sin status visible — los pares quedan recuperables apenas se guardan

Las actualizaciones de status llegan en tiempo real — no hace falta refrescar.

La barra de acción

Justo debajo de la sub-nav, un banner con estado te dice exactamente qué está pasando. Su mensaje cambia según el estado global del chatbot:

Situación	Mensaje
Un crawl está corriendo	"Discovering pages — URLs will appear below as we find them…"
Entrenamiento en curso	"Training in progress…"
Sobre el límite del plan	"Over plan limit — reduce training content to retrain."
Esperando fuentes	"Preparing N source(s) — retrain unlocks once they're ready."
Cambios sin guardar	"You have unsaved changes — click Retrain agent* to apply."*
Nada para hacer	"Agent is up to date"

El mismo banner muestra estadísticas agregadas (cantidad de fuentes + caracteres usados / máximo) y, cuando tiene sentido, un botón Retrain agent a la derecha.

Presupuesto de caracteres

Justo debajo de la barra de acción, una barra de uso de Training content muestra dónde estás parado contra el tope de caracteres entrenados de tu plan:

┌──────────────────────────────────────────────┐
│  Training content                            │
│  ████████████████░░░░░     380K / 400K       │
└──────────────────────────────────────────────┘

Cuando tu total supera el tope, el banner se pone rojo y los retrain se bloquean. O eliminás fuentes o subís de plan — ver Planes y precios.

Qué cuenta hacia el presupuesto de caracteres

Solo los caracteres mostrados cuentan:

Files — texto extraído (no los bytes crudos del archivo)
URLs — contenido extraído de la página (las URLs excluidas se ignoran en el total en vivo)
Q&A — pregunta + respuesta + variaciones combinadas
Text — el largo crudo del snippet

Así que un PDF de 3 MB cargado de imágenes puede extraer muy poco, mientras que un PDF de 300 KB solo de texto puede agregar cientos de miles de caracteres. Revisá el contador de caracteres de cada fuente cuando termine de procesarse.

Siguientes pasos

Subir archivos — PDF / DOCX / TXT, hasta 10 MB cada uno
URLs de sitio web — URL individual o crawl del sitio entero
Preguntas y respuestas — pares precisos para preguntas difíciles
Importación masiva de Q&A — hasta 500 filas por vez
Reentrenamiento — cuándo hacer clic en Retrain agent

← Anterior

System prompt

Subir archivos