1. Learn
  2. /
  3. कोर्स
  4. /
  5. LangChain के साथ Retrieval Augmented Generation (RAG)

Connected

अभ्यास

Python फाइलों को स्प्लिट करना

हालाँकि टेक्स्ट और कोड फाइलों में वही अक्षर होते हैं, कोड फाइलों में नैचुरल लैंग्वेज से परे विशिष्ट स्ट्रक्चर होते हैं। डॉक्यूमेंट स्प्लिटिंग के दौरान इस कोड-विशेष संदर्भ को बनाए रखने के लिए, आपको स्प्लिटर को इस तरह प्रोग्राम करना चाहिए कि वह पहले सबसे आम कोड स्ट्रक्चर पर स्प्लिट करने की कोशिश करे। सौभाग्य से, LangChain में इसके लिए तैयार फ़ंक्शनैलिटी उपलब्ध है!

आपके लिए सभी आवश्यक क्लासेज़ इम्पोर्ट कर दी गई हैं, जिनमें langchain_text_splitters से Language भी शामिल है।

निर्देश

100 XP
  • एक recursive character splitter बनाइए जो सामान्य Python कोड स्ट्रक्चर पर स्प्लिट करे.
  • python_data डॉक्यूमेंट लोडर को छोटे-छोटे चंक्स में स्प्लिट करें.