Ka0s: Pipeline de Conocimiento

En una plataforma operativa real, responder y aprender son dos verbos distintos.

Responder (online) exige latencia baja y disponibilidad.
Aprender (offline) exige throughput, tiempo, CPU/IO y, a veces, horas de procesamiento.

En Ka0s lo convertimos en arquitectura: un Knowledge Pipeline desacoplado.

El problema (cuando todo comparte lo mismo)

Vectorizar bases de datos completas (MongoDB, PostgreSQL, MySQL) implica:

Si el mismo servicio de modelos atiende embeddings e inferencia interactiva, el agente sufre: colas, timeouts y respuestas lentas.

El diseño en core/docs/ka0s_agent_knowledge_pipeline/01_concept.md propone separar explícitamente:

Plano Online (Query)
- embeddings de la pregunta + búsqueda en pgvector + generación.
Plano Offline (Ingesta)
- extracción/normalización/chunking + embeddings masivos.
Plano Offline (Carga)
- UPSERT por lotes a PostgreSQL-IA (pgvector), con idempotencia.

Esta separación es el corazón del sistema: aunque haya un “batch” corriendo durante horas, el agente sigue respondiendo.

La idea clave: embeddings no compiten con la generación.

Prioridades claras (online primero).
Ingesta controlable (batch, límites, retención en spool).
Trazabilidad: source, record_id, chunk_id, embedding_model, embedding_dim.

Mañana: cómo pasamos de “spool” a “vector store” sin duplicados, y por qué el loader es tan importante.

Tags: post ka0s ai rag kubernetes knowledge