Mise à jour avec la possibilité de mettre des images

2026-04-21 02:47:09 +02:00
parent bffbe1a662
commit 17f197484a
125 changed files with 4866 additions and 348 deletions
--- a/brain/app/core/config.py
+++ b/brain/app/core/config.py
@@ -19,9 +19,16 @@ class Settings(BaseSettings):
    )

    ollama_base_url: str = "http://localhost:11434"
-    llm_model: str = "gemma4:e2b"
+    llm_model: str = "gemma4:26b"
    llm_timeout_seconds: int = 120

+    # Fenêtre de contexte (num_ctx Ollama). Défaut Ollama = 2048, trop étroit
+    # dès que le Structural Context du Lore dépasse ~10 pages (b9). On monte
+    # à 16384 pour tenir ~100 pages enrichies. Coût VRAM : ~600 MB de KV cache
+    # supplémentaire (vs 2048) pour le modèle gemma 2B. Surchargeable via
+    # LLM_NUM_CTX dans .env si besoin (ex: VRAM limitée → 8192).
+    llm_num_ctx: int = 16384
+

@lru_cache
 def get_settings() -> Settings: