1. Learn
  2. /
  3. कोर्स
  4. /
  5. LangChain के साथ Retrieval Augmented Generation (RAG)

Connected

अभ्यास

डॉक्युमेंट्स को एम्बेड करना और स्टोर करना

रिट्रीवल के लिए डॉक्युमेंट्स तैयार करने का अंतिम चरण है उन्हें एम्बेड करना और स्टोर करना. आप OpenAI के text-embedding-3-small मॉडल का उपयोग चंक किए गए डॉक्युमेंट्स को एम्बेड करने के लिए करेंगे, और उन्हें लोकल Chroma वेक्टर डेटाबेस में स्टोर करेंगे.

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks पेपर को recursively स्प्लिट करके जो chunks आपने बनाए थे, वे प्री-लोड किए गए हैं.

इस अभ्यास में OpenAI API key बनाना और उपयोग करना आवश्यक नहीं है. आप <OPENAI_API_TOKEN> placeholder को जैसा है वैसा ही छोड़ सकते हैं, जिससे OpenAI API को वैध रिक्वेस्ट्स भेजी जाएँगी.

निर्देश

100 XP
  • OpenAI से डिफॉल्ट एम्बेडिंग मॉडल इनिशियलाइज़ करें.
  • embedding_model का उपयोग करके डॉक्युमेंट chunks को एम्बेड करें और उन्हें Chroma वेक्टर डेटाबेस में स्टोर करें.