1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Retrieval Augmented Generation (RAG) z LangChain

Connected

Exercise

Podział plików Python

Choć pliki tekstowe i pliki z kodem zawierają te same znaki, kod ma struktury wykraczające poza język naturalny. Aby zachować ten kontekst podczas podziału dokumentów, warto skonfigurować splitter tak, by w pierwszej kolejności próbował dzielić tekst według najczęstszych struktur kodu. Na szczęście LangChain oferuje dokładnie taką funkcjonalność!

Wszystkie niezbędne klasy zostały już zaimportowane, w tym Language z langchain_text_splitters.

Instrukcje

100 XP
  • Utwórz rekurencyjny splitter znaków, który będzie dzielić tekst według typowych struktur kodu Python.
  • Podziel dokumenty załadowane przez python_data na fragmenty.