Metin optimizasyonundan çokça bahsettik, ancak belgelerinizde görseller veya tablolar varsa, bu öğelerin de asistanınız tarafından kullanılabilir olması için birkaç ek adım atmak önemlidir. Metin dışı içerik olan görseller, grafikler ve tablolar değerli bilgiler içerebilir; ancak dikkatli bir hazırlık yapılmazsa, bir LLM bu bilgileri göz ardı edebilir veya yanlış yorumlayabilir.
Önce görsellerle başlayalım. Belgelerinizde herhangi bir görsel varsa—bu bir ürün fotoğrafı ya da çok biçimlendirilmiş bir metin olabilir—bunu dosyanızı yüklemeden önce düz metne dönüştürmek iyi bir fikirdir. Botpress, dosyalarınızı yükledikten sonra zaten ön işlemden geçirir; ancak dosyalarınızdan tutarlı yanıtlar almak için en iyi yol, bu dönüşümü kendiniz yapmaktır.
Örneğin, bu biçimlendirilmiş restoran menüsünü ele alalım. Düz metin dosyasına dönüştürmeden önce, LLM'nin üzerinde çalışabileceği bilgi, ayrıştırıldıktan sonra bu şekilde görünür. Bunun yerine, yüklemeden önce markdown'a dönüştürürsek (veya yerleşik Botpress zengin metin düzenleyicisini kullanırsak), çok daha güvenilir sonuçlar elde ederiz.
Şimdi de tablolardan ve yapılandırılmış verilerden bahsedelim. Belgelerinize tablolar ekliyorsanız, RAG işlemi yapılmadan önce dosyalarınızın markdown'a dönüştürüldüğünü unutmayın. Burada iki seçeneğiniz var: Bilgilerinizi yapılandırmak için yerleşik bir Botpress tablosunu bilgi tabanı olarak belirleyebilirsiniz ya da aşağıdaki gibi markdown biçimli bir tablo kullanabilirsiniz.
Metin dışı içeriği optimize etmek; görselleri OCR ile işlemek, karmaşık görseller için açıklamalar eklemek ve tabloların yapay zeka asistanınız tarafından kullanılabilecek şekilde sunulmasını sağlamak anlamına gelir. Buradaki amacımız, hem metin hem de metin dışı içeriği içeren tüm veri setini bir LLM'nin kolayca okuyabileceği hale getirmektir.
