1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 LangChain 开发 LLM 应用

Connected

道练习

PDF 文档加载器

要开始实现 Retrieval Augmented Generation(RAG,检索增强生成),您首先需要加载模型将要访问的文档。这些文档可以来自多种来源,LangChain 为其中许多来源都提供了文档加载器。

在本练习中,您将使用文档加载器来加载一份 PDF 文档,内容为 Balaguer 等人在 2024 年发表的论文《RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture》。

注意:用于在 LangChain 中加载 PDF 文档的依赖项 pypdf 已为您预先安装。

说明

100 XP
  • 在 LangChain 中导入用于加载 PDF 文档的合适类。
  • 为当前目录中的 'rag_vs_fine_tuning.pdf' 文档创建一个文档加载器。
  • 将文档加载到内存中,以便查看第一个文档(或页面)的内容。