Aan de slagGa gratis aan de slag

HTML-documentloaders

Je kunt documenten laden uit veel verschillende bestandsindelingen, ook uit complexe formaten zoals HTML.

In deze oefening laad je een HTML-bestand met een Executive Order van het Witte Huis.

Deze oefening maakt deel uit van de cursus

LLM-toepassingen ontwikkelen met LangChain

Cursus bekijken

Oefeninstructies

  • Gebruik de klasse UnstructuredHTMLLoader om het bestand white_house_executive_order_nov_2023.html in de huidige map te laden.
  • Laad de documenten in het geheugen.
  • Print het eerste document.
  • Print de metadata van het eerste document.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

from langchain_community.document_loaders import UnstructuredHTMLLoader

# Create a document loader for unstructured HTML
loader = ____

# Load the document
data = ____

# Print the first document
print(____)

# Print the first document's metadata
print(____)
Code bewerken en uitvoeren