1. Learn
  2. /
  3. Courses
  4. /
  5. 使用 LangChain 的 Retrieval Augmented Generation (RAG)

Connected

Exercise

为 RAG 加载 PDF 文件

要开始实现 Retrieval Augmented Generation(RAG,检索增强生成),您首先需要加载模型将要访问的文档。文档来源多样,LangChain 为其中许多来源都提供了文档加载器。

在本练习中,您将使用文档加载器来加载一份 PDF 文档,其中包含 Lewis 等人在 2021 年发表的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》(面向知识密集型 NLP 任务的检索增强生成)。该文件已为您提供,文件名为 'rag_paper.pdf'。

注意:用于在 LangChain 中加载 PDF 文档的依赖项 pypdf 已为您安装完毕。

Instructions

100 XP
  • 在 LangChain 中导入用于加载 PDF 文档的相应类。
  • 为 'rag_paper.pdf' 文档创建一个文档加载器。
  • 将文档加载到内存中,以查看第一个文档(或页面)的内容。