Periodische Health-Checks für inaktive Embedding-Modelle

Als Entwicklerin möchte ich, dass beim F13 Deployment nur die in configs/general.yml unter active_llms aktivierten Embedding-Modelle auf API-Verfügbarkeit geprüft werden.

Aktuell werden inaktive Embedding-Modelle, die zwar in configs/llm_models.yml definiert sind, trotzdem periodisch überprüft (z. B. jina_embeddings_v2_mock). Das führt zu unnötigen API-Checks und kann zu Verwirrung führen.

Beobachtetes Verhalten:

  • configs/llm_models.yml enthält z. B. jina_embeddings_v2 und jina_embeddings_v2_mock
  • configs/general.yml aktiviert nur jina_embeddings_v2
  • RAG prüft trotzdem periodisch jina_embeddings_v2_mock

Analyse / Ursache: In src/utils/process_configs.py werden die definierten Embedding-Modelle nicht mit den aktiven/ausgewählten Modellen abgeglichen.

Akzeptanzkriterien

  • Es werden nur die in configs/general.yml unter active_llms aktivierten Embedding-Modelle auf API-Verfügbarkeit geprüft.
  • Inaktive Embedding-Modelle (definiert, aber nicht aktiviert) werden nicht periodisch geprüft.
  • Review einer zweiten Person durchgeführt
To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information