CommencerCommencez gratuitement

Chargeurs de documents HTML

Il est possible de charger des documents dans de nombreux formats différents, y compris des formats complexes tels que HTML.

Dans cet exercice, vous allez charger un fichier HTML contenant un décret présidentiel de la Maison Blanche.

Cet exercice fait partie du cours

<cours>Développement d'applications LLM avec LangChain</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez la classe UnstructuredHTMLLoader pour charger le fichier white_house_executive_order_nov_2023.html dans le répertoire actuel.
  • Chargez les documents dans la mémoire.
  • Imprimez le premier document.
  • Imprimez les métadonnées du premier document.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

from langchain_community.document_loaders import UnstructuredHTMLLoader

# Create a document loader for unstructured HTML
loader = ____

# Load the document
data = ____

# Print the first document
print(____)

# Print the first document's metadata
print(____)
Modifier et exécuter le code