1. Learn
  2. /
  3. Курси
  4. /
  5. Retrieval Augmented Generation (RAG) з LangChain

Connected

вправа

Завантаження HTML‑файлів для RAG

Документи можна завантажувати з багатьох різних форматів, зокрема з таких складних, як HTML.

Якщо ви не працювали з HTML, це мова розмітки для створення вебсторінок. Ось невеликий приклад:

<!DOCTYPE html>
<html>
<body>
  <h2>Heading</h2>
  <p>Here's some text and an image below:</p>
  <img src="image.jpg" alt="..." width="104" height="142">
</body>
</html>

У цій вправі ви завантажите HTML‑файл, що містить вебсторінку публікації блогу DataCamp. Необхідні класи вже імпортовано для вас.

Інструкції

100 XP
  • Використайте клас UnstructuredHTMLLoader, щоб завантажити файл datacamp-blog.html у поточному каталозі.
  • Завантажте документи в памʼять.
  • Виведіть вміст сторінки першого документа.
  • Виведіть метадані першого документа.