Chargeurs de documents HTML
Il est possible de charger des documents dans de nombreux formats différents, y compris des formats complexes tels que HTML.
Dans cet exercice, vous allez charger un fichier HTML contenant un décret présidentiel de la Maison Blanche.
Cet exercice fait partie du cours
<cours>Développement d'applications LLM avec LangChain</cours>Instructions de l’exercice
- Utilisez la classe
UnstructuredHTMLLoaderpour charger le fichierwhite_house_executive_order_nov_2023.htmldans le répertoire actuel. - Chargez les documents dans la mémoire.
- Imprimez le premier document.
- Imprimez les métadonnées du premier document.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)