1. Learn
  2. /
  3. कोर्स
  4. /
  5. LangChain के साथ Retrieval Augmented Generation (RAG)

Connected

अभ्यास

RAG के लिए HTML फ़ाइलें लोड करना

आप कई अलग-अलग फ़ॉर्मैट्स से डॉक्यूमेंट्स लोड कर सकते हैं, जिनमें HTML जैसे जटिल फ़ॉर्मैट भी शामिल हैं.

यदि आप HTML से परिचित नहीं हैं, तो यह वेब पेज बनाने के लिए एक मार्कअप लैंग्वेज है. यहाँ एक छोटा उदाहरण है:

<!DOCTYPE html>
<html>
<body>
  <h2>Heading</h2>
  <p>Here's some text and an image below:</p>
  <img src="image.jpg" alt="..." width="104" height="142">
</body>
</html>

इस अभ्यास में, आप एक HTML फ़ाइल लोड करेंगे जिसमें DataCamp ब्लॉग पोस्ट का वेबपेज है. आवश्यक क्लासेज आपके लिए पहले से इम्पोर्ट कर दी गई हैं.

निर्देश

100 XP
  • वर्तमान डायरेक्टरी में मौजूद datacamp-blog.html फ़ाइल को लोड करने के लिए UnstructuredHTMLLoader क्लास का उपयोग करें.
  • डॉक्यूमेंट्स को मेमोरी में लोड करें.
  • पहले डॉक्यूमेंट का पेज कंटेंट प्रिंट करें.
  • पहले डॉक्यूमेंट का मेटाडेटा प्रिंट करें.