1. How is RAG different from fine-tuning an LLM?

RAG (Retrieval-Augmented Generation) is different from fine-tuning because RAG keeps the original LLM unchanged and injects external knowledge at runtime by retrieving relevant documents. Fine-tuning modifies the model's weights using training data, which requires more compute and must be repeated for every update.

2. What kinds of data sources are not suitable for RAG?

Data sources that are unsuitable for RAG include non-text formats like scanned documents, image-based PDFs, audio files without transcripts, and outdated or conflicting content. These types of data reduce the accuracy of retrieved context.

3. How does RAG compare to in-context learning techniques like prompt engineering?

RAG differs from prompt engineering by retrieving relevant content from a large indexed knowledge base at query time, rather than relying on static, manually embedded examples in the prompt. This allows RAG to scale better and maintain up-to-date knowledge without retraining.

4. Can I use RAG with third-party LLMs like OpenAI, Anthropic, or Mistral?

Yes, you can use RAG with LLMs from OpenAI, Anthropic, Mistral, or others by handling the retrieval pipeline independently and sending the retrieved context to the LLM via its API. RAG is model-agnostic as long as the LLM supports receiving contextual input through prompts.

5. What does ongoing maintenance look like for a RAG-enabled AI agent?

Ongoing maintenance for a RAG-enabled AI agent includes updating the knowledge base with new or corrected documents, re-indexing content periodically, evaluating retrieval quality, tuning chunk size and embedding methods, and monitoring the agent's responses for drift or hallucination issues.

Yapay zekada getirmeli üretim (RAG) nedir?

Yazan

Sarah Chudleigh

Araştırmacı & Yapay Zekâ İçerik Lideri

İçindekiler

Adım 1. adımın başlığı burada beklendiği gibi yer alır

Özet

RAG, güvenilir verilerden bilgi çekmeyi LLM üretimiyle birleştirir ve yapay zeka yanıtlarının doğru, ilgili ve gerçek iş bilgilerine dayalı olmasını sağlar.
Sadece LLM'lere kıyasla, RAG yanıtları belirli belgelere, veri tabanlarına veya onaylanmış içeriklere dayandırarak hayal ürünü yanıtları azaltır.
RAG, güncel bilgileri destekler ve yapay zeka sistemlerinin, LLM'in sabit eğitim verisinin ötesinde, son değişiklikler veya özel konular hakkında soruları yanıtlamasını sağlar.
Bir RAG sistemini sürdürmek, verilerin güncel tutulmasını, çıktıların izlenmesini ve bilgi çekme yöntemlerinin zaman içinde en iyi performans için iyileştirilmesini gerektirir.

RAG, kuruluşların yapay zekadan daha az riskle yararlanmasına olanak tanır.

Bilgiye dayalı üretim, daha fazla işletme yapay zeka çözümleri sunmaya başladıkça popülerleşiyor. İlk kurumsal sohbet botları riskli hatalar ve hayal ürünü yanıtlar üretti.

RAG, şirketlerin LLM'lerin gücünden yararlanmasını sağlarken üretken çıktıyı kendi iş bilgilerine dayandırır.

Yapay Zekâ Sohbet Botları Oluşturun

Özel ajan tabanlı sohbet botları oluşturun

Hemen başlayın

Getirmeli üretim nedir?

Yapay zekada retrieval-augmented generation (RAG), a) ilgili harici bilgileri getirme ve b) yapay zeka tarafından oluşturulan yanıtları birleştirerek doğruluk ve alaka düzeyini artıran bir tekniktir.

Retrieval-augmented generation is a combination of retrieval and generation

Büyük dil modellerinin (LLM) üretimine güvenmek yerine, RAG modellerinin yanıtları, yapay zeka ajanı oluşturucusu tarafından belirlenen bilgi tabanlarına dayanır – örneğin bir şirketin web sayfası veya bir İK politika dokümanı gibi.

RAG iki ana adımda çalışır:

1. Bilgi Çekme

Model, yapılandırılmış veya yapılandırılmamış kaynaklardan (ör. veri tabanları, PDF'ler, HTML dosyaları veya diğer belgeler) ilgili verileri arar ve çeker. Bu kaynaklar yapılandırılmış (ör. tablolar) veya yapılandırılmamış (ör. onaylanmış web siteleri) olabilir.

2. Üretim

Bilgi çekildikten sonra, bu bilgiler LLM'e aktarılır. LLM, onaylanmış verileri kendi dil yetenekleriyle birleştirerek doğru, insan gibi ve markaya uygun yanıtlar üretir.

RAG Kullanım Alanı Örnekleri

RAG'ın amacı nedir? Kuruluşların ilgili, bilgilendirici ve doğru çıktı sunmasını sağlar.

RAG, yanlış LLM çıktısı veya hayal ürünü yanıt riskini doğrudan azaltmanın bir yoludur.

Örnek 1: Hukuk Bürosu

Bir hukuk bürosu, yapay zeka sisteminde RAG'ı şu amaçlarla kullanabilir:

Araştırma sırasında belge veri tabanlarından ilgili içtihatları, emsal kararları ve hukuki hükümleri aramak.
Dava dosyalarından ve geçmiş kararlardan anahtar bilgileri çıkararak dava özetleri oluşturmak.
Çalışanlara otomatik olarak ilgili mevzuat güncellemelerini sağlamak.

Örnek 2: Emlak Ajansı

Bir emlak ajansı, yapay zeka sisteminde RAG'ı şu amaçlarla kullanabilir:

Gayrimenkul işlem geçmişleri ve mahalle suç istatistiklerinden verileri özetlemek.
Yerel gayrimenkul yasalarını ve düzenlemelerini referans göstererek taşınmaz işlemleriyle ilgili hukuki soruları yanıtlamak.
Gayrimenkul durum raporları, piyasa trendleri ve geçmiş satışlardan veri çekerek ekspertiz süreçlerini hızlandırmak.

Örnek 3: E-Ticaret Mağazası

Bir e-ticaret sitesi, yapay zeka sisteminde RAG'ı şu amaçlarla kullanabilir:

Kişiselleştirilmiş ürün önerileri için şirket veri tabanından ürün bilgisi, teknik özellikler ve yorumları toplamak.
Kullanıcı tercihlerine göre özelleştirilmiş alışveriş deneyimleri oluşturmak için sipariş geçmişini çekmek.
Müşteri segmentasyon verilerini ve son satın alma alışkanlıklarını birleştirerek hedefli e-posta kampanyaları oluşturmak.

RAG'ın Faydaları

3 benefits of RAG: prevent hallucinations, retrieve up-to-date information, communicate in complex contexts

ChatGPT veya Claude'a soru soran herkesin bildiği gibi, LLM'lerde yerleşik koruma önlemleri çok azdır.

Uygun denetim olmadan, yanlış veya zararlı bilgiler üretebilirler ve bu da onları gerçek dünyada güvenilmez kılar.

RAG, yanıtları güvenilir ve güncel veri kaynaklarına dayandırarak bu riskleri önemli ölçüde azaltır.

Hayal ürünü ve yanlış yanıtları önleyin

Geleneksel dil modelleri, kulağa inandırıcı gelen ancak gerçekte yanlış veya alakasız yanıtlar üretebilir (bunlara hayal ürünü yanıtlar denir).

RAG, yanıtları güvenilir ve son derece ilgili veri kaynaklarına dayandırarak hayal ürünü yanıtları azaltır.

Bilgi çekme adımı, modelin doğru ve güncel bilgilere başvurmasını sağlar; bu da hayal ürünü yanıt olasılığını önemli ölçüde azaltır ve güvenilirliği artırır.

Güncel bilgiye ulaşın

LLM'ler birçok görev için güçlü araçlar olsa da, nadir veya yeni bilgiler – özel iş bilgileri dahil – hakkında doğru bilgi veremezler.

Ancak RAG, modelin herhangi bir kaynaktan, web sitesi, tablo veya veri tabanı dahil, gerçek zamanlı bilgi çekmesini sağlar.

Bu da, güvenilir bilgi kaynağı güncellendiği sürece, modelin güncel bilgiyle yanıt vereceği anlamına gelir.

Karmaşık ortamlarda iletişim kurun

Geleneksel LLM kullanımının bir diğer zayıf noktası, bağlam bilgisinin kaybolmasıdır.

LLM'ler uzun veya karmaşık konuşmalarda bağlamı korumakta zorlanır. Bu da genellikle eksik veya bölük yanıtlarla sonuçlanır.

Ancak bir RAG modeli, doğrudan anlamca bağlantılı veri kaynaklarından bilgi çekerek bağlam farkındalığı sağlar.

Kullanıcıların ihtiyaçlarına özel ek bilgilerle – örneğin ürün kataloğuna sahip bir satış sohbet botu – RAG, yapay zeka ajanlarının bağlamsal konuşmalara katılmasını sağlar.

RAG nasıl çalışır?

1. Belge Yükleme

Öncelikle, oluşturucu bir belge veya dosyayı yapay zeka ajanının kütüphanesine yükler. Dosya bir web sayfası, PDF veya desteklenen başka bir format olabilir ve yapay zekanın bilgi tabanının bir parçasını oluşturur.

2. Belge Dönüştürme

Çünkü birçok dosya türü vardır – PDF, web sayfası vb. – sistem bu dosyaları standart bir metin formatına dönüştürür, böylece yapay zekanın bu bilgileri işlemesi ve ilgili verileri çekmesi kolaylaşır.

Yapay Zeka Ajanları mı Dağıtılıyor?

Yapay Zeka Temsilcisi Uygulama Rehberimizi okuyun

Şimdi Oku

3. Parçalara Ayırma ve Depolama

Dönüştürülen belge daha sonra daha küçük, yönetilebilir parçalara ayrılır. Bu parçalar bir veri tabanında saklanır ve yapay zeka ajanının sorgu sırasında ilgili bölümleri verimli şekilde arayıp bulmasını sağlar.

4. Kullanıcı Sorgusu

Bilgi tabanları kurulduktan sonra, bir kullanıcı yapay zeka ajanına bir soru sorabilir. Sorgu, kullanıcının ne sorduğunu anlamak için doğal dil işleme (NLP) kullanılarak işlenir.

5. Bilgi Çekme

Yapay zeka ajanı, yüklenen belgelerden kullanıcının sorusunu yanıtlayabilecek en alakalı bilgi parçalarını bulmak için saklanan parçalarda arama yapar ve bilgi çekme algoritmalarını kullanır.

6. Yanıt Üretimi

Son olarak, yapay zeka ajanı, çekilen bilgileri dil modeli yetenekleriyle birleştirerek, sorguya ve elde edilen verilere dayalı tutarlı ve bağlamsal olarak doğru bir yanıt oluşturur.

Gelişmiş RAG Özellikleri

Bir geliştirici değilseniz, her RAG'ın aynı şekilde oluşturulmadığını öğrenmek sizi şaşırtabilir.

Farklı sistemler, ihtiyaçlarına, kullanım alanına veya beceri seviyesine göre farklı RAG modelleri oluşturur.

Bazı yapay zeka platformları, yapay zeka yazılımınızın doğruluğunu ve güvenilirliğini daha da artırabilecek gelişmiş RAG özellikleri sunar.

Anlamsal ve basit parçalara ayırma

Basit parçalara ayırma, bir belgenin anlam veya bağlam gözetmeksizin sabit boyutlu parçalara bölünmesidir; örneğin, metni 500 kelimelik bölümlere ayırmak gibi.

Anlamsal parçalara ayırma ise, belgeyi içeriğe göre anlamlı bölümlere ayırır.

Bu yöntem, paragraflar veya konu başlıkları gibi doğal ayrımları dikkate alır ve her parçanın bütünlüklü bir bilgi içermesini sağlar.

Zorunlu kaynak gösterimi

Finans veya sağlık gibi yüksek riskli konuşmaları yapay zekayla otomatikleştiren sektörlerde, kaynak gösterimi, kullanıcıların bilgiye güvenmesini sağlayabilir.

Geliştiriciler, RAG modellerine gönderdikleri her bilgi için kaynak göstermesini talimat verebilirler. Geliştiriciler, RAG modellerine gönderilen her bilgi için kaynak göstermesini isteyebilirler.

Örneğin, bir çalışan bir yapay zeka sohbet botundan sağlık hakları hakkında bilgi isterse, sohbet botu yanıt verirken ilgili çalışan hakları belgesine bir bağlantı da sunabilir.

Özel RAG Yapay Zeka Ajanı Oluşturun

En yeni LLM'lerin gücünü kendi kurumsal bilgilerinizle birleştirin.

Botpress, esnek ve sınırsızca genişletilebilen bir yapay zeka sohbet botu platformudur.

Kullanıcıların her türlü kullanım senaryosu için her türden yapay zeka ajanı veya sohbet botu oluşturmasına olanak tanır – ve piyasadaki en gelişmiş RAG sistemini sunar.

Sohbet botunuzu herhangi bir platforma veya kanala entegre edin ya da önceden hazırlanmış entegrasyon kütüphanemizden seçim yapın. Botpress YouTube kanalındaki eğitimlerle veya Botpress Academy'deki ücretsiz kurslarla hemen başlayın.

Bugün oluşturmaya başlayın. Ücretsizdir.

Yapay Zekâ Sohbet Botları Oluşturun

Özel ajan tabanlı sohbet botları oluşturun

Hemen başlayın

Sıkça Sorulan Sorular

1. RAG, bir LLM'i ince ayar yapmaktan nasıl farklıdır?

RAG (Retrieval-Augmented Generation), ince LLM'in orijinal halini değiştirmeden, ilgili belgeleri çalıştırma sırasında dışarıdan bilgi ekleyerek çalıştığı için ince ayardan farklıdır. İnce ayar ise modelin ağırlıklarını eğitim verisiyle değiştirir, bu da daha fazla işlem gücü gerektirir ve her güncellemede tekrarlanmalıdır.

2. Hangi tür veri kaynakları RAG için uygun değildir?

RAG için uygun olmayan veri kaynakları arasında taranmış belgeler gibi metin olmayan formatlar, görüntü tabanlı PDF'ler, transkripti olmayan ses dosyaları ve güncelliğini yitirmiş veya çelişkili içerikler bulunur. Bu tür veriler, elde edilen bağlamın doğruluğunu azaltır.

3. RAG, prompt engineering gibi bağlam içi öğrenme teknikleriyle nasıl karşılaştırılır?

RAG, sorgu sırasında büyük bir indekslenmiş bilgi tabanından ilgili içeriği getirerek, prompt mühendisliğinde olduğu gibi statik ve elle eklenmiş örneklere dayanmaz. Bu sayede RAG daha iyi ölçeklenir ve yeniden eğitim gerektirmeden güncel bilgi sağlar.

4. RAG'i OpenAI, Anthropic veya Mistral gibi üçüncü parti LLM'lerle kullanabilir miyim?

Evet, RAG'i OpenAI, Anthropic, Mistral veya diğer LLM'lerle kullanabilirsiniz; bunun için getirme sürecini bağımsız olarak yönetip elde edilen bağlamı LLM'e API üzerinden göndermeniz yeterlidir. LLM, prompt yoluyla bağlamsal girdi almayı desteklediği sürece RAG modelden bağımsız çalışır.

5. RAG özellikli bir yapay zeka asistanı için sürekli bakım nasıl olur?

RAG özellikli bir yapay zeka asistanının sürekli bakımı; bilgi tabanının yeni veya düzeltilmiş belgelerle güncellenmesi, içeriğin periyodik olarak yeniden indekslenmesi, getirme kalitesinin değerlendirilmesi, parça boyutu ve gömleme yöntemlerinin ayarlanması ve asistanın yanıtlarının sapma veya halüsinasyon açısından izlenmesini içerir.