1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Retrieval Augmented Generation (RAG) với LangChain

Connected

Bài tập

Tách các tệp Python

Mặc dù tệp văn bản và tệp mã đều chứa các ký tự giống nhau, tệp mã có những cấu trúc vượt ra ngoài ngôn ngữ tự nhiên. Để giữ được ngữ cảnh đặc thù của mã khi tách tài liệu, bạn nên lập trình splitter để ưu tiên tách theo các cấu trúc mã phổ biến nhất. May mắn là LangChain đã cung cấp sẵn chức năng cho việc này!

Tất cả các lớp cần thiết đã được nhập sẵn cho bạn, bao gồm Language từ langchain_text_splitters.

Hướng dẫn

100 XP
  • Tạo một recursive character splitter sẽ tách theo các cấu trúc mã Python phổ biến.
  • Tách dữ liệu từ document loader python_data thành các đoạn nhỏ.