HTML carregadores de documentos
É possível carregar documentos de vários formatos diferentes, inclusive formatos complexos como HTML.
Neste exercício, você carregará um arquivo HTML que contém uma ordem executiva da Casa Branca.
Este exercício faz parte do curso
Desenvolvimento de aplicativos LLM com LangChain
Instruções de exercício
- Use a classe
UnstructuredHTMLLoader
para carregar o arquivowhite_house_executive_order_nov_2023.html
no diretório atual. - Carregue os documentos na memória.
- Imprimir o primeiro documento.
- Imprimir os metadados do primeiro documento.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)