Chargeurs de documents HTML
Il est possible de charger des documents dans de nombreux formats différents, y compris des formats complexes tels que HTML.
Dans cet exercice, vous allez charger un fichier HTML contenant un décret présidentiel de la Maison Blanche.
Cet exercice fait partie du cours
Développement d'applications LLM avec LangChain
Instructions
- Utilisez la classe
UnstructuredHTMLLoader
pour charger le fichierwhite_house_executive_order_nov_2023.html
dans le répertoire actuel. - Chargez les documents dans la mémoire.
- Imprimez le premier document.
- Imprimez les métadonnées du premier document.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)