1. Learn
  2. /
  3. Курси
  4. /
  5. Retrieval Augmented Generation (RAG) з LangChain

Connected

вправа

Розбиття файлів Python

Хоча текстові й кодові файли містять ті самі символи, у файлах коду є структури, що виходять за межі природної мови. Щоб зберегти цей контекст, специфічний для коду, під час розбиття документів, варто налаштувати розділювач так, щоб він спочатку намагався розбивати за найпоширенішими кодовими структурами. На щастя, LangChain надає для цього готову функціональність!

Усі потрібні класи вже імпортовано для вас, зокрема Language з langchain_text_splitters.

Інструкції

100 XP
  • Створіть рекурсивний символьний розділювач, який розбиватиме за поширеними структурами коду Python.
  • Розбийте завантажувач документів python_data на частини.