Aan de slagBegin gratis

HTML-documentloaders

Je kunt documenten laden uit veel verschillende bestandsindelingen, ook uit complexe formaten zoals HTML.

In deze oefening laad je een HTML-bestand met een Executive Order van het Witte Huis.

Deze oefening maakt deel uit van de cursus

LLM-toepassingen ontwikkelen met LangChain

Bekijk cursus

Oefeninstructies

  • Gebruik de klasse UnstructuredHTMLLoader om het bestand white_house_executive_order_nov_2023.html in de huidige map te laden.
  • Laad de documenten in het geheugen.
  • Print het eerste document.
  • Print de metadata van het eerste document.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

from langchain_community.document_loaders import UnstructuredHTMLLoader

# Create a document loader for unstructured HTML
loader = ____

# Load the document
data = ____

# Print the first document
print(____)

# Print the first document's metadata
print(____)
Code bewerken en uitvoeren