ComenzarEmpieza gratis

HTML cargadores de documentos

Es posible cargar documentos de muchos formatos diferentes, incluidos formatos complejos como HTML.

En este ejercicio, cargarás un archivo HTML que contiene una orden ejecutiva de la Casa Blanca.

Este ejercicio forma parte del curso

Desarrollar aplicaciones LLM con LangChain

Ver curso

Instrucciones de ejercicio

  • Utiliza la clase UnstructuredHTMLLoader para cargar el archivo white_house_executive_order_nov_2023.html en el directorio actual.
  • Carga los documentos en la memoria.
  • Imprime el primer documento.
  • Imprime los metadatos del primer documento.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

from langchain_community.document_loaders import UnstructuredHTMLLoader

# Create a document loader for unstructured HTML
loader = ____

# Load the document
data = ____

# Print the first document
print(____)

# Print the first document's metadata
print(____)
Editar y ejecutar código