Carregadores de documentos HTML
É possível carregar documentos de vários formatos diferentes, incluindo formatos complexos como HTML.
Neste exercício, você vai carregar um arquivo HTML com uma ordem executiva da Casa Branca.
Este exercicio faz parte do curso
Desenvolvimento de aplicativos de LLM com LangChain
Instruções do exercicio
- Use a classe
UnstructuredHTMLLoaderpara carregar o arquivowhite_house_executive_order_nov_2023.htmlno diretório atual. - Carregue os documentos na memória.
- Imprima o primeiro documento.
- Imprima os metadados do primeiro documento.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)