Mulai sekarangMulai gratis

Memuat file PDF untuk RAG

Untuk mulai menerapkan Retrieval Augmented Generation (RAG), Anda terlebih dahulu perlu memuat dokumen yang akan diakses oleh model. Dokumen ini dapat berasal dari berbagai sumber, dan LangChain mendukung pemuat dokumen untuk banyak di antaranya.

Pada latihan ini, Anda akan menggunakan pemuat dokumen untuk memuat dokumen PDF yang berisi makalah Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks oleh Lewis dkk. (2021). File ini tersedia untuk Anda dengan nama 'rag_paper.pdf'.

Catatan: pypdf, dependensi untuk memuat dokumen PDF di LangChain, sudah diinstal untuk Anda.

Latihan ini merupakan bagian dari kursus

Retrieval Augmented Generation (RAG) dengan LangChain

Lihat Kursus

Instruksi latihan

  • Impor kelas yang sesuai untuk memuat dokumen PDF di LangChain.
  • Buat pemuat dokumen untuk dokumen 'rag_paper.pdf'.
  • Muat dokumen ke memori untuk melihat konten dokumen atau halaman pertama.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_paper.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Edit dan Jalankan Kode