5
rag
7
6
5
4
2
3
1
5
15
11
9
20
18
19
17
16
15
14
13
12
11
10
8
7
6
5
4
3
2
1
10
18
17
16
14
13
12
10
9
8
7
6
4
3
2
1
9
8
7
6
5
4
3
2
1
7
6
5
4
3
2
1
6
5
4
3
2
1
บทเรียนถัดไป
บทเรียนถัดไป
ในบทเรียนนี้

เราได้พูดถึงการปรับแต่งข้อความไปมากแล้ว แต่ถ้าเอกสารของคุณมีรูปภาพหรือตารางอยู่ด้วย คุณควรดำเนินการเพิ่มเติมเล็กน้อยเพื่อให้ส่วนเหล่านี้สามารถใช้งานได้กับเอเจนต์ของคุณ เนื้อหาที่ไม่ใช่ข้อความ เช่น รูปภาพ แผนภูมิ และตาราง มักมีข้อมูลสำคัญ แต่ถ้าไม่ได้เตรียมให้ดี LLM อาจมองข้ามหรือแปลความข้อมูลเหล่านั้นผิดได้

มาเริ่มที่รูปภาพกันก่อน หากเอกสารของคุณมีรูปภาพ เช่น ภาพถ่ายสินค้า หรือข้อความที่ตกแต่งอย่างสวยงาม ควรแปลงให้เป็นข้อความธรรมดา ก่อน อัปโหลดไฟล์ Botpress จะประมวลผลไฟล์ของคุณให้อยู่แล้วหลังอัปโหลด แต่ถ้าคุณแปลงเองก่อน จะช่วยให้ได้คำตอบที่สม่ำเสมอมากขึ้นจากไฟล์ของคุณ

ขอยกตัวอย่างเมนูร้านอาหารที่ตกแต่งมาอย่างสวยงามนี้ ก่อนแปลงเป็นไฟล์ข้อความธรรมดา ข้อมูลที่ LLM จะได้รับหลังจากแยกข้อมูลแล้วจะมีลักษณะดังนี้ แต่ถ้าเราแปลงเป็นมาร์กดาวน์ก่อนอัปโหลด (หรือใช้ตัวแก้ไขข้อความของ Botpress) ก็จะได้ผลลัพธ์ที่น่าเชื่อถือมากกว่า

ต่อไปมาดูเรื่องตารางและข้อมูลที่มีโครงสร้าง หากคุณใส่ตารางไว้ในเอกสาร ก่อนทำ RAG ไฟล์ของคุณจะถูกแปลงเป็นมาร์กดาวน์ คุณมีสองทางเลือก คือ กำหนดตารางของ Botpress ให้เป็นฐานความรู้เพื่อให้ข้อมูลมีโครงสร้าง หรือใช้ตารางที่จัดรูปแบบด้วยมาร์กดาวน์แบบนี้

การปรับแต่งเนื้อหาที่ไม่ใช่ข้อความ หมายถึงการประมวลผลรูปภาพด้วย OCR เพิ่มคำอธิบายสำหรับภาพที่ซับซ้อน และจัดรูปแบบตารางให้เอเจนต์ AI ของคุณสามารถใช้งานได้ เป้าหมายของเราคือทำให้ชุดข้อมูลทั้งหมด—ทั้งข้อความและเนื้อหาที่ไม่ใช่ข้อความ—อ่านง่ายสำหรับ LLM

สรุป
แปลงรูปภาพและเอกสารที่มีการตกแต่งให้เป็นข้อความธรรมดา ปรับแต่งตารางด้วยรูปแบบที่มีโครงสร้างหรือใช้มาร์กดาวน์ และจัดการเนื้อหาที่ไม่ใช่ข้อความเพื่อให้เอเจนต์ AI ของคุณสามารถตีความและใช้งานข้อมูลทั้งหมดในชุดข้อมูลได้อย่างถูกต้อง
บทเรียนทั้งหมดในคอร์สนี้
Fresh green broccoli floret with thick stalks.