Pemuat dokumen HTML
Anda dapat memuat dokumen dari berbagai format, termasuk format kompleks seperti HTML.
Dalam latihan ini, Anda akan memuat file HTML yang berisi perintah eksekutif Gedung Putih.
Latihan ini adalah bagian dari kursus
Mengembangkan Aplikasi LLM dengan LangChain
Petunjuk latihan
- Gunakan kelas
UnstructuredHTMLLoaderuntuk memuat filewhite_house_executive_order_nov_2023.htmldi direktori saat ini. - Muat dokumen ke memori.
- Cetak dokumen pertama.
- Cetak metadata dari dokumen pertama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from langchain_community.document_loaders import UnstructuredHTMLLoader
# Create a document loader for unstructured HTML
loader = ____
# Load the document
data = ____
# Print the first document
print(____)
# Print the first document's metadata
print(____)