Academy
Cách tối ưu hóa tệp cho RAG
Giới thiệu về khóa học
1
rag
8
7
6
5
4
2
3
1
5
15
11
9
20
18
19
17
16
15
14
13
12
11
10
8
7
6
5
4
3
2
1
10
18
17
16
14
13
12
10
9
8
7
6
4
3
2
1
9
8
7
6
5
4
3
2
1
7
6
5
4
3
2
1
6
5
4
3
2
1
Bài học tiếp theo
Bài học tiếp theo
Trong bài học này

Trong khóa học này, chúng ta sẽ tìm hiểu cách tối ưu hóa tệp và dữ liệu cho Retrieval-Augmented Generation, hay gọi tắt là RAG.

Kết thúc khóa học, bạn sẽ có các bước thực tiễn để cải thiện chất lượng phản hồi mà LLM tạo ra khi sử dụng nguồn kiến thức tùy chỉnh.

RAG kết hợp hai khái niệm mạnh mẽ: truy xuấttạo sinh. Nó cho phép tác nhân AI của bạn lấy thông tin chính xác từ các nguồn dữ liệu lớn, như danh mục sản phẩm hoặc danh sách chính sách, sau đó sử dụng mô hình ngôn ngữ để tạo ra câu trả lời tự nhiên, đầy đủ thông tin. Điều này có nghĩa là tác nhân không chỉ trả lời mà còn cung cấp câu trả lời đúng từ nguồn đáng tin cậy—nhanh chóng và chính xác.

Nhưng vấn đề là: chất lượng phản hồi của tác nhân phụ thuộc rất nhiều vào chất lượng và cấu trúc dữ liệu bạn cung cấp. Nếu dữ liệu đầu vào lộn xộn, dư thừa hoặc không có cấu trúc, câu trả lời của tác nhân cũng sẽ như vậy. Đây là lúc xử lý dữ liệu trước trở nên quan trọng. Khi chuẩn bị dữ liệu cẩn thận, bạn đang xây dựng nền tảng cho các phản hồi chất lượng cao, có ý nghĩa và chính xác.

Trong loạt bài này, chúng tôi sẽ hướng dẫn bạn mọi điều cần biết để chuẩn bị tệp và dữ liệu sẵn sàng cho RAG. Chúng ta sẽ đề cập đến:

  • Cách cấu trúc tài liệu để rõ ràng,
  • Các phương pháp tốt nhất để làm sạch và đơn giản hóa văn bản,
  • Thêm metadata và tóm tắt để tăng ngữ cảnh,
  • Tối ưu hóa dữ liệu không phải văn bản, như hình ảnh và bảng biểu,
  • Kiểm tra và duy trì dữ liệu.

Mỗi video sẽ phân tích từng bước với ví dụ minh họa, giúp bạn có những kiến thức thực tiễn để áp dụng trực tiếp vào dự án AI của mình. Sau loạt bài này, bạn sẽ có đủ công cụ để lấy bất kỳ bộ dữ liệu nào, chuyển đổi nó cho RAG và tối ưu hóa hiệu suất của các tác nhân AI của mình.

Tóm tắt
Mỗi video sẽ phân tích từng bước với ví dụ minh họa, giúp bạn có những kiến thức thực tiễn để áp dụng trực tiếp vào dự án AI của mình. Sau loạt bài này, bạn sẽ có đủ công cụ để lấy bất kỳ bộ dữ liệu nào, chuyển đổi nó cho RAG và tối ưu hóa hiệu suất của các tác nhân AI của mình.
tất cả bài học trong khóa học này
Fresh green broccoli floret with thick stalks.