HTML cargadores de documentos
Es posible cargar documentos de muchos formatos diferentes, incluidos formatos complejos como HTML.
En este ejercicio, cargarás un archivo HTML que contiene una orden ejecutiva de la Casa Blanca.
Este ejercicio forma parte del curso
Desarrollar aplicaciones LLM con LangChain
Instrucciones de ejercicio
- Utiliza la clase
UnstructuredHTMLLoader
para cargar el archivowhite_house_executive_order_nov_2023.html
en el directorio actual. - Carga los documentos en la memoria.
- Imprime el primer documento.
- Imprime los metadatos del primer documento.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)