Periodische Health-Checks für inaktive Embedding-Modelle

Als Entwicklerin möchte ich, dass beim F13 Deployment nur die in configs/general.yml unter active_llms aktivierten Embedding-Modelle auf API-Verfügbarkeit geprüft werden.

Aktuell werden inaktive Embedding-Modelle, die zwar in configs/llm_models.yml definiert sind, trotzdem periodisch überprüft (z. B. jina_embeddings_v2_mock). Das führt zu unnötigen API-Checks und kann zu Verwirrung führen.

Beobachtetes Verhalten:

configs/llm_models.yml enthält z. B. jina_embeddings_v2 und jina_embeddings_v2_mock
configs/general.yml aktiviert nur jina_embeddings_v2
RAG prüft trotzdem periodisch jina_embeddings_v2_mock

Analyse / Ursache: In src/utils/process_configs.py werden die definierten Embedding-Modelle nicht mit den aktiven/ausgewählten Modellen abgeglichen.

Akzeptanzkriterien

Es werden nur die in configs/general.yml unter active_llms aktivierten Embedding-Modelle auf API-Verfügbarkeit geprüft.
Inaktive Embedding-Modelle (definiert, aber nicht aktiviert) werden nicht periodisch geprüft.
Review einer zweiten Person durchgeführt

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information