MulaiMulai sekarang secara gratis

Pemuatan dokumen PDF

Untuk mulai mengimplementasikan Retrieval Augmented Generation (RAG), Anda terlebih dahulu perlu memuat dokumen yang akan diakses oleh model. Dokumen-dokumen ini dapat berasal dari berbagai sumber, dan LangChain mendukung pemuat dokumen untuk banyak di antaranya.

Dalam latihan ini, Anda akan menggunakan pemuat dokumen untuk memuat dokumen PDF yang berisi makalah berjudul RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture oleh Balaguer dkk. (2024).

Catatan: pypdf, dependensi untuk memuat dokumen PDF di LangChain, telah diinstal untuk Anda.

Latihan ini adalah bagian dari kursus

Mengembangkan Aplikasi LLM dengan LangChain

Lihat Kursus

Petunjuk latihan

  • Impor kelas yang sesuai untuk memuat dokumen PDF di LangChain.
  • Buat pemuat dokumen untuk dokumen 'rag_vs_fine_tuning.pdf', yang tersedia di direktori saat ini.
  • Muat dokumen ke memori untuk melihat konten dokumen atau halaman pertama.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Edit dan Jalankan Kode