Sözlük · ai
RAG (Retrieval Augmented Generation)
Tanım
RAG (Retrieval Augmented Generation), bir LLM'in kendi eğitim verisinin ötesinde şirket-spesifik dokümanlara 'bakarak' cevap üretme yöntemidir. Doküman vector DB'ye embed edilir, soru gelince ilgili chunk'lar LLM context'ine eklenir; hallucination düşer, cevap kalitesi artar.
Detaylı açıklama
RAG'in 7 adımı: doküman toplama → preprocessing → chunking (200-1000 token) → embedding → vector DB'ye yazma → retrieval (top-K chunks) → LLM'e context olarak verme + cevap üretme + kaynak atıf.
Vector DB seçenekleri (2026): Pinecone (managed, en olgun), Weaviate (open source), Qdrant (Rust-based hızlı), pgvector (Postgres extension), Chroma (POC). Maliyet: $70-500/ay üretim için.
Embedding modelleri: OpenAI text-embedding-3-large, Cohere embed-v3, Voyage AI voyage-3-large. Kalite + maliyet trade-off; Türkçe için Cohere/Voyage avantajlı.
RAG vs fine-tuning: RAG hızlı + güncel + ekonomik (yeni doküman = sadece embed). Fine-tuning derin domain adaptation için ama maliyetli + sabit. RAG kurumsal kullanımda %95 yeterli.
Kullanım senaryoları
→Müşteri destek chatbot (RAG ile şirket dokümanlarına dayalı)
→İç bilgi tabanı arama (Confluence, Notion)
→Hukuk firmalarında sözleşme analizi
→Sağlık hizmetlerinde tıbbi rehber sorgulama
→E-ticaret ürün arama + öneri
Güçlü yanlar
- +Hallucination düşürür (kaynaklı cevap)
- +Şirket-spesifik bilgi entegre
- +Yeni doküman = sadece embed (model değişmez)
- +Audit + traceability (her cevabın kaynağı)
Zayıf yanlar
- −Vector DB + embedding maliyeti ($70-500/ay)
- −Chunking strategy kritik (kalite belirler)
- −Multi-turn conversation context yönetimi karmaşık
- −Production için 3-6 ay (POC kolay, scale zor)
İlgili terimler
İlgili hizmetler
RAG (Retrieval Augmented Generation) ile ilgili proje planlıyorsan
30 dakikalık keşif görüşmesinde projene özel mimari + maliyet + ekip önerisini yazılı paylaşıyoruz.
Keşif görüşmesi başlat