CommencerCommencer gratuitement

Chargeurs de documents HTML

Il est possible de charger des documents dans de nombreux formats différents, y compris des formats complexes tels que HTML.

Dans cet exercice, vous allez charger un fichier HTML contenant un décret présidentiel de la Maison Blanche.

Cet exercice fait partie du cours

Développement d'applications LLM avec LangChain

Afficher le cours

Instructions

  • Utilisez la classe UnstructuredHTMLLoader pour charger le fichier white_house_executive_order_nov_2023.html dans le répertoire actuel.
  • Chargez les documents dans la mémoire.
  • Imprimez le premier document.
  • Imprimez les métadonnées du premier document.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

from langchain_community.document_loaders import UnstructuredHTMLLoader

# Create a document loader for unstructured HTML
loader = ____

# Load the document
data = ____

# Print the first document
print(____)

# Print the first document's metadata
print(____)
Modifier et exécuter le code