1. 学习
  2. /
  3. 课程
  4. /
  5. LangChain으로 배우는 Retrieval Augmented Generation (RAG)

Connected

练习

Python 파일 분할하기

텍스트와 코드 파일은 같은 문자로 이루어져 있지만, 코드 파일에는 자연어를 넘어서는 구조가 있습니다. 문서 분할 시 이러한 코드 특유의 문맥을 유지하려면, 가장 일반적인 코드 구조를 기준으로 먼저 분할하도록 분할기를 설정해야 해요. 다행히 LangChain에는 이를 손쉽게 처리할 수 있는 기능이 있습니다!

필요한 클래스는 모두 임포트되어 있으며, langchain_text_splitters의 Language도 포함되어 있습니다.

说明

100 XP
  • 일반적인 Python 코드 구조를 기준으로 분할하는 재귀적 문자 분할기를 생성하세요.
  • python_data 문서 로더를 청크로 분할하세요.