1. 学ぶ
  2. /
  3. コース
  4. /
  5. LangChain で学ぶ Retrieval Augmented Generation (RAG)

Connected

演習

RAGのためにPDFファイルを読み込む

Retrieval Augmented Generation(RAG)を実装するには、まずモデルが参照するドキュメントを読み込む必要があります。これらのドキュメントはさまざまなソースから取得でき、LangChainは多くのソースに対応したドキュメントローダーを提供しています。

この演習では、Lewis ら(2021)の論文「Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks」を含むPDFドキュメントを、ドキュメントローダーで読み込みます。ファイル名は 'rag_paper.pdf' として用意されています。

Note: LangChainでPDFドキュメントを読み込むための依存関係である pypdf は、すでにインストール済みです。

指示

100 XP
  • LangChainでPDFドキュメントを読み込むための適切なクラスをインポートします。
  • 'rag_paper.pdf' 用のドキュメントローダーを作成します。
  • ドキュメントをメモリに読み込み、最初のドキュメント(またはページ)の内容を確認します。