Senaryo 2
RAG tabanlı ürün asistanı
Sorduğunuz soruya vector retrieval ile en yakın 5 ürünü çekip chat modeline bağlam olarak
verir. Yanıt streaming olarak token-token gelir. Her çağrı vector.query_log'a yazılır.
Retrieval: ollama / nomic-embed-text
Chat: ollama / llama3.1:8b-instruct-q4_K_M
Örnek
