1. Learn
  2. /
  3. Courses
  4. /
  5. Retrieval Augmented Generation (RAG) with LangChain

Connected

Exercise

Rozdělování souborů v Pythonu

Textové a kódové soubory sice obsahují stejné znaky, ale kódové soubory mají strukturu, která přesahuje přirozený jazyk. Aby se tento kontext specifický pro kód při rozdělování dokumentů neztratil, je potřeba splitter nastavit tak, aby se nejprve pokoušel rozdělovat podle nejběžnějších struktur kódu. LangChain naštěstí tuhle funkci nabízí!

Všechny potřebné třídy jsou už naimportované, včetně Language z langchain_text_splitters.

Instructions

100 XP
  • Vytvoř rekurzivní znakový splitter, který bude rozdělovat podle běžných struktur kódu v Pythonu.
  • Rozděl document loader python_data na části.