Periodische Health-Checks für inaktive Embedding-Modelle
Als Entwicklerin möchte ich, dass beim F13 Deployment nur die in configs/general.yml unter active_llms aktivierten Embedding-Modelle auf API-Verfügbarkeit geprüft werden.
Aktuell werden inaktive Embedding-Modelle, die zwar in configs/llm_models.yml definiert sind, trotzdem periodisch überprüft (z. B. jina_embeddings_v2_mock). Das führt zu unnötigen API-Checks und kann zu Verwirrung führen.
Beobachtetes Verhalten:
-
configs/llm_models.ymlenthält z. B.jina_embeddings_v2undjina_embeddings_v2_mock -
configs/general.ymlaktiviert nurjina_embeddings_v2 - RAG prüft trotzdem periodisch
jina_embeddings_v2_mock
Analyse / Ursache: In src/utils/process_configs.py werden die definierten Embedding-Modelle nicht mit den aktiven/ausgewählten Modellen abgeglichen.
Akzeptanzkriterien
-
Es werden nur die in configs/general.ymlunteractive_llmsaktivierten Embedding-Modelle auf API-Verfügbarkeit geprüft. -
Inaktive Embedding-Modelle (definiert, aber nicht aktiviert) werden nicht periodisch geprüft. -
Review einer zweiten Person durchgeführt