1
rag
8
7
6
5
4
2
3
1
5
15
11
9
20
18
19
17
16
15
14
13
12
11
10
8
7
6
5
4
3
2
1
10
18
17
16
14
13
12
10
9
8
7
6
4
3
2
1
9
8
7
6
5
4
3
2
1
7
6
5
4
3
2
1
6
5
4
3
2
1
下一课
下一课
本课内容

在本课程中,我们将学习如何为检索增强生成(RAG)优化文件和数据。

课程结束时,你将获得一套可操作的步骤,帮助你在使用自定义知识源时提升大语言模型(LLM)生成回复的质量。

RAG 结合了两个强大的概念:检索生成。它让你的 AI 智能体能够从庞大的数据源(如产品目录或政策清单)中精准提取信息,并利用语言模型生成自然且有信息量的回复。这意味着智能体不仅能给出答案,还能快速、准确地从可信来源提供正确答案

但关键在于:智能体回复的质量很大程度上取决于你输入数据的质量和结构。如果数据杂乱、冗余或无结构,智能体的回答也会受到影响。这就是数据预处理至关重要的原因。通过精心准备数据,你为高质量、有意义且准确的回复打下了基础。

在本系列中,我们将带你全面了解如何为 RAG 准备文件和数据。我们将涵盖:

  • 如何清晰地组织文档结构,
  • 文本清理与简化的最佳实践,
  • 添加元数据和摘要以丰富上下文,
  • 优化非文本数据,如图片和表格,
  • 数据验证与维护。

每个视频都会通过实例详细讲解这些步骤,为你的 AI 项目提供可直接应用的实用见解。完成本系列后,你将掌握将任意数据集转化为 RAG 并优化 AI 智能体性能的工具。

摘要
每个视频都会通过实例详细讲解这些步骤,为你的 AI 项目提供可直接应用的实用见解。完成本系列后,你将掌握将任意数据集转化为 RAG 并优化 AI 智能体性能的工具。
本课程全部课程
Fresh green broccoli floret with thick stalks.