1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 LangChain 的 Retrieval Augmented Generation (RAG)

Connected

道练习

拆分 Python 文件

尽管文本文件和代码文件都由字符组成,但代码文件还包含超出自然语言的结构。为在文档拆分时保留这些代码特有的上下文,您应让分割器优先按照最常见的代码结构进行拆分。幸运的是,LangChain 已提供了相应功能!

所有必需的类都已为您导入,包括来自 langchain_text_splitters 的 Language。

说明

100 XP
  • 创建一个递归字符分割器,用于按常见的 Python 代码结构进行拆分。
  • 将 python_data 文档加载器拆分为多个块。