1. Nauka
  2. /
  3. Kursy
  4. /
  5. Retrieval Augmented Generation (RAG) z LangChain

Connected

ćwiczenie

Wczytywanie plików HTML do RAG

Dokumenty można wczytywać z wielu różnych formatów – w tym z bardziej złożonych, takich jak HTML.

Jeśli nie znasz HTML-a, to język znaczników służący do tworzenia stron internetowych. Oto krótki przykład:

<!DOCTYPE html>
<html>
<body>
  <h2>Heading</h2>
  <p>Here's some text and an image below:</p>
  <img src="image.jpg" alt="..." width="104" height="142">
</body>
</html>

W tym ćwiczeniu wczytasz plik HTML zawierający stronę wpisu z bloga DataCamp. Niezbędne klasy zostały już zaimportowane.

Instrukcje

100 XP
  • Użyj klasy UnstructuredHTMLLoader, aby wczytać plik datacamp-blog.html z bieżącego katalogu.
  • Załaduj dokumenty do pamięci.
  • Wyświetl zawartość strony pierwszego dokumentu.
  • Wyświetl metadane pierwszego dokumentu.