En operaciones, lo más caro no es el fallo: es el tiempo entre detectar y corregir.
La autoremediación de Ka0s (documentada en core/docs/ka0s_remediation/04_autoremediation.md) convierte una señal en un flujo reproducible.
Cómo funciona
- Se detecta el problema (monitorización o humano).
- Se crea/actualiza una Issue y se etiqueta con
auto-remediate:<tipo>. - GitHub Actions dispara el workflow de autoremediación.
- Se enruta al workflow específico (por ejemplo, high-load).
- Se ejecuta la corrección (SSH, kubectl, etc.).
- El bot comenta el resultado en la Issue.
Lo importante no es la magia, es el contrato
- Entrada: una etiqueta estandarizada.
- Ejecución: un workflow reproducible.
- Salida: evidencia y feedback en el mismo ticket.
Así la operación deja de depender de “quién estaba de guardia” y pasa a depender de un proceso controlado.