RAG Настройки и Конфигурация

Chunking Настройки
500 1000 2000
📌 Препоръка: 800-1200 символа за балансирана точност
50 200 500
📌 Препоръка: 15-25% от chunk размера
💡 Какво е chunking?
Chunking разделя големи документи на по-малки части (chunk-ове). Overlap осигурява че контекстът не се губи между chunk-овете.

Пример: Документ с 5000 символа → 5-6 chunk-а по 1000 символа с 200 overlap
Търсене Настройки
📌 Препоръка: 3-7 chunks за оптимален контекст
0.3 0.70 0.95
📌 Препоръка: 0.60-0.75 за балансирани резултати
💡 Какво е similarity threshold?
Минималната сходност между въпроса и chunk-а за да се включи в резултатите.
  • 0.9-1.0: Почти идентични (много строго)
  • 0.7-0.9: Много сходни (препоръчително)
  • 0.5-0.7: Умерено сходни (по-широко търсене)
  • 0.3-0.5: Слабо сходни (може да дава ирелевантни резултати)
Embedding Настройки
Текущ: gaianet/Nomic-embed-text-v1.5-Embedding-GGUF
📌 Колко chunk-а да обработва наведнъж (1-10)
Ако е деактивирано, ще се използва текстово търсене
⚠️ ВАЖНО: За да работят embeddings, трябва да имаш зареден embedding модел в LM Studio! Текущият модел claude-3.7-sonnet-reasoning-gemma3-12b е за chat, не за embeddings.
Разширени Настройки
Назад
Тестване на настройките