このレッスンで
このコースでは、Retrieval-Augmented Generation(RAG)のためにファイルやデータを最適化する方法を学びます。
コース修了時には、カスタム知識ソースを使ってLLMが生成する回答の質を向上させるための具体的な手順が身につきます。
RAGは、検索と生成という2つの強力な仕組みを組み合わせたものです。これにより、AIエージェントは商品カタログやポリシー一覧など膨大なデータソースから正確な情報を取得し、言語モデルを使って自然で有益な回答を生成できます。つまり、単に答えるだけでなく、信頼できる情報源から正しい答えを素早く正確に提供できるエージェントを実現します。
ただし重要なのは、エージェントの回答の質は、入力するデータの質や構造に大きく左右されるという点です。もしデータが散らかっていたり、重複していたり、構造化されていなければ、エージェントの回答にもその影響が現れます。ここでデータの前処理が重要になります。データを丁寧に準備することで、高品質で意味のある正確な回答の基盤を作ることができます。
このシリーズでは、RAGのためにファイルやデータを準備するために必要な知識をすべて解説します。内容は以下の通りです。
- 分かりやすいドキュメント構造の作り方
- テキストのクリーニングと簡素化のベストプラクティス
- より豊かな文脈のためのメタデータや要約の追加方法
- 画像や表など非テキストデータの最適化
- データの検証とメンテナンス
各動画ではこれらのステップを例とともに分かりやすく解説し、AIプロジェクトですぐに活用できる実践的な知識を提供します。このシリーズを終える頃には、どんなデータセットでもRAG用に変換し、AIエージェントのパフォーマンスを最適化するためのスキルが身につきます。
概要
各動画ではこれらのステップを例とともに分かりやすく解説し、AIプロジェクトですぐに活用できる実践的な知識を提供します。このシリーズを終える頃には、どんなデータセットでもRAG用に変換し、AIエージェントのパフォーマンスを最適化するためのスキルが身につきます。
このコースの全レッスン
