HTML-documentloaders
Je kunt documenten laden uit veel verschillende bestandsindelingen, ook uit complexe formaten zoals HTML.
In deze oefening laad je een HTML-bestand met een Executive Order van het Witte Huis.
Deze oefening maakt deel uit van de cursus
LLM-toepassingen ontwikkelen met LangChain
Oefeninstructies
- Gebruik de klasse
UnstructuredHTMLLoaderom het bestandwhite_house_executive_order_nov_2023.htmlin de huidige map te laden. - Laad de documenten in het geheugen.
- Print het eerste document.
- Print de metadata van het eerste document.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)