HTML caricatori di documenti
È possibile caricare documenti da molti formati diversi, compresi formati complessi come HTML.
In questo esercizio caricherai un file HTML contenente un ordine esecutivo della Casa Bianca.
Questo esercizio fa parte del corso
Sviluppare applicazioni LLM con LangChain
Istruzioni dell'esercizio
- Utilizza la classe
UnstructuredHTMLLoaderper caricare il filewhite_house_executive_order_nov_2023.htmlnella directory corrente. - Carica i documenti in memoria.
- Stampa il primo documento.
- Stampa i metadati del primo documento.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)