RAG için Dosyalar Nasıl Optimize Edilir | Görseller ve Tablolar

Kurslar

Başlangıç

İlk Yapay Zeka Asistanınız

Studio Arayüzü

Panel Arayüzü

Orta Düzey

Fiyatlandırma

Otonom Düğümler

İleri Düzey

RAG için Dosyaları Optimize Etme

Bu derste

Metin optimizasyonundan çokça bahsettik, ancak belgelerinizde görseller veya tablolar varsa, bu öğelerin de asistanınız tarafından kullanılabilir olması için birkaç ek adım atmak önemlidir. Metin dışı içerik olan görseller, grafikler ve tablolar değerli bilgiler içerebilir; ancak dikkatli bir hazırlık yapılmazsa, bir LLM bu bilgileri göz ardı edebilir veya yanlış yorumlayabilir.

Önce görsellerle başlayalım. Belgelerinizde herhangi bir görsel varsa—bu bir ürün fotoğrafı ya da çok biçimlendirilmiş bir metin olabilir—bunu dosyanızı yüklemeden önce düz metne dönüştürmek iyi bir fikirdir. Botpress, dosyalarınızı yükledikten sonra zaten ön işlemden geçirir; ancak dosyalarınızdan tutarlı yanıtlar almak için en iyi yol, bu dönüşümü kendiniz yapmaktır.

Örneğin, bu biçimlendirilmiş restoran menüsünü ele alalım. Düz metin dosyasına dönüştürmeden önce, LLM'nin üzerinde çalışabileceği bilgi, ayrıştırıldıktan sonra bu şekilde görünür. Bunun yerine, yüklemeden önce markdown'a dönüştürürsek (veya yerleşik Botpress zengin metin düzenleyicisini kullanırsak), çok daha güvenilir sonuçlar elde ederiz.

Şimdi de tablolardan ve yapılandırılmış verilerden bahsedelim. Belgelerinize tablolar ekliyorsanız, RAG işlemi yapılmadan önce dosyalarınızın markdown'a dönüştürüldüğünü unutmayın. Burada iki seçeneğiniz var: Bilgilerinizi yapılandırmak için yerleşik bir Botpress tablosunu bilgi tabanı olarak belirleyebilirsiniz ya da aşağıdaki gibi markdown biçimli bir tablo kullanabilirsiniz.

Metin dışı içeriği optimize etmek; görselleri OCR ile işlemek, karmaşık görseller için açıklamalar eklemek ve tabloların yapay zeka asistanınız tarafından kullanılabilecek şekilde sunulmasını sağlamak anlamına gelir. Buradaki amacımız, hem metin hem de metin dışı içeriği içeren tüm veri setini bir LLM'nin kolayca okuyabileceği hale getirmektir.

‍

Özet

Görselleri ve biçimlendirilmiş belgeleri düz metne dönüştürün, tabloları yapılandırılmış biçimlendirme veya markdown ile optimize edin ve metin dışı içeriği işleyerek yapay zeka asistanınızın veri setinizdeki tüm bilgileri doğru şekilde yorumlayıp kullanabilmesini sağlayın.

bu kurstaki tüm dersler

Kursa Giriş

2 dk

RAG için Veri Yapılandırma

1 dk

Metin Ön İşleme

2 dk

Belge İçeriğini Geliştirme

2 dk

Görseller ve Tablolar

3 dk

Bakım ve Doğrulama

2 dk

Fresh green broccoli floret with thick stalks.