1. Learn
  2. /
  3. Cursuri
  4. /
  5. Retrieval Augmented Generation (RAG) cu LangChain

Connected

exercițiu

Încărcarea fișierelor HTML pentru RAG

Documentele pot fi încărcate din multe formate diferite, inclusiv formate mai complexe precum HTML.

Dacă nu ești familiarizat cu HTML, acesta este un limbaj de marcare folosit pentru crearea paginilor web. Iată un exemplu simplu:

<!DOCTYPE html>
<html>
<body>
  <h2>Heading</h2>
  <p>Here's some text and an image below:</p>
  <img src="image.jpg" alt="..." width="104" height="142">
</body>
</html>

În acest exercițiu, vei încărca un fișier HTML care conține o pagină de blog de pe DataCamp. Clasele necesare au fost deja importate pentru tine.

Instrucțiuni

100 XP
  • Folosește clasa UnstructuredHTMLLoader pentru a încărca fișierul datacamp-blog.html din directorul curent.
  • Încarcă documentele în memorie.
  • Afișează conținutul paginii pentru primul document.
  • Afișează metadatele primului document.