Cómo funciona el entrenamiento
Los cuatro tipos de fuente, el flujo de status, el medidor de presupuesto de caracteres y la barra de acción que te dice qué hacer.
"Training" en ChatbotGen significa alimentar el chatbot con contenido para que pueda responder con precisión. La pestaña Training es donde pasa ese trabajo. Esta página es la vista panorámica — cada tipo de fuente tiene su propia guía.
Cuatro tipos de fuente
Cada chatbot puede tomar conocimiento de cuatro tipos. La página Training tiene una pestaña por tipo, cada una con un contador en vivo:
┌────────────────────────────────────────────────┐
│ Files (3) URLs (12) Q&A (8) Text (2) │
└────────────────────────────────────────────────┘
- Files — subidas de PDF, DOCX, TXT. Ver Subir archivos.
- URLs — páginas individuales o crawls de todo el sitio. Ver URLs de sitio web.
- Q&A — pares de pregunta/respuesta escritos a mano con variaciones. Ver Preguntas y respuestas.
- Text — fragmentos de texto pegados directo. (Guía dedicada próximamente — por ahora, ver la pestaña Text en tu chatbot.)
Las cuatro alimentan el mismo retriever. Al chatbot no le importa de dónde vino un dato — busca en todo.
Flujo de status
Cada fuente individual lleva su propio status:
-
Files:
pending→processing→completed(ofailed) -
URLs:
pending→crawling→completed(ofailed) -
Text:
pending→processing→completed(ofailed) - Q&A: sin status visible — los pares quedan recuperables apenas se guardan
Las actualizaciones de status llegan en tiempo real — no hace falta refrescar.
La barra de acción
Justo debajo de la sub-nav, un banner con estado te dice exactamente qué está pasando. Su mensaje cambia según el estado global del chatbot:
| Situación | Mensaje |
|---|---|
| Un crawl está corriendo | "Discovering pages — URLs will appear below as we find them…" |
| Entrenamiento en curso | "Training in progress…" |
| Sobre el límite del plan | "Over plan limit — reduce training content to retrain." |
| Esperando fuentes | "Preparing N source(s) — retrain unlocks once they're ready." |
| Cambios sin guardar | "You have unsaved changes — click Retrain agent to apply." |
| Nada para hacer | "Agent is up to date" |
El mismo banner muestra estadísticas agregadas (cantidad de fuentes + caracteres usados / máximo) y, cuando tiene sentido, un botón Retrain agent a la derecha.
Presupuesto de caracteres
Justo debajo de la barra de acción, una barra de uso de Training content muestra dónde estás parado contra el tope de caracteres entrenados de tu plan:
┌──────────────────────────────────────────────┐
│ Training content │
│ ████████████████░░░░░ 380K / 400K │
└──────────────────────────────────────────────┘
Cuando tu total supera el tope, el banner se pone rojo y los retrain se bloquean. O eliminás fuentes o subís de plan — ver Planes y precios.
Qué cuenta hacia el presupuesto de caracteres
Solo los caracteres mostrados cuentan:
- Files — texto extraído (no los bytes crudos del archivo)
- URLs — contenido extraído de la página (las URLs excluidas se ignoran en el total en vivo)
- Q&A — pregunta + respuesta + variaciones combinadas
- Text — el largo crudo del snippet
Así que un PDF de 3 MB cargado de imágenes puede extraer muy poco, mientras que un PDF de 300 KB solo de texto puede agregar cientos de miles de caracteres. Revisá el contador de caracteres de cada fuente cuando termine de procesarse.
Siguientes pasos
- Subir archivos — PDF / DOCX / TXT, hasta 10 MB cada uno
- URLs de sitio web — URL individual o crawl del sitio entero
- Preguntas y respuestas — pares precisos para preguntas difíciles
- Importación masiva de Q&A — hasta 500 filas por vez
- Reentrenamiento — cuándo hacer clic en Retrain agent