Ka0s: Del Spool a pgvector | Ka0s Project Blog

Una ingesta masiva no falla “a lo grande”: falla en detalles pequeños.

Por eso en Ka0s la ingesta no escribe directo en la Vector DB. Primero pasa por un spool y después por un loader.

Spool: un buffer operativo, no un “tmp”

El spool es un volumen persistente sobre NFS (StorageClass nfs-client) y sirve para:

Formato mínimo viable:

Referencia: core/docs/ka0s_agent_knowledge_pipeline/03_technical.md.

Un loader serio hace 3 cosas:

La idempotencia se basa en una clave única como:

(source, record_id, chunk_id, embedding_model)

Si ejecutas dos veces el mismo run, actualiza, no duplica.

Mañana: el motivo real por el que dividimos Ollama en dos servicios, y cómo eso protege la experiencia del agente.

Tags: post ka0s pgvector postgresql rag data