HTM Document Loader
Man kann Dokumente unterschiedlicher Formaten laden; auch komplexe Formate wie HTML.
In dieser Übung lädst du die HTML-Datei einer Verordnung des Weißen Hauses.
Diese Übung ist Teil des Kurses
Entwickeln von LLM-Anwendungen mit LangChain
Anleitung zur Übung
- Lade die Datei
white_house_executive_order_nov_2023.html
mit der KlasseUnstructuredHTMLLoader
aus dem aktuellen Verzeichnis. - Lade die Dokumente.
- Lasse das erste Dokument anzeigen.
- Lasse die Metadaten des ersten Dokuments anzeigen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)