MulaiMulai sekarang secara gratis

Memuat file PDF untuk RAG

Untuk mulai menerapkan Retrieval Augmented Generation (RAG), Anda terlebih dahulu perlu memuat dokumen yang akan diakses oleh model. Dokumen ini dapat berasal dari berbagai sumber, dan LangChain mendukung pemuat dokumen untuk banyak di antaranya.

Pada latihan ini, Anda akan menggunakan pemuat dokumen untuk memuat dokumen PDF yang berisi makalah Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks oleh Lewis dkk. (2021). File ini tersedia untuk Anda dengan nama 'rag_paper.pdf'.

Catatan: pypdf, dependensi untuk memuat dokumen PDF di LangChain, sudah diinstal untuk Anda.

Latihan ini adalah bagian dari kursus

Retrieval Augmented Generation (RAG) dengan LangChain

Lihat Kursus

Petunjuk latihan

  • Impor kelas yang sesuai untuk memuat dokumen PDF di LangChain.
  • Buat pemuat dokumen untuk dokumen 'rag_paper.pdf'.
  • Muat dokumen ke memori untuk melihat konten dokumen atau halaman pertama.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_paper.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Edit dan Jalankan Kode