MulaiMulai sekarang secara gratis

Memahami BM25

Sebelum Anda mulai mengintegrasikan BM25 sparse retriever ke dalam arsitektur RAG Anda, sebaiknya uji terlebih dahulu pada beberapa string pendek untuk mendapatkan intuisi tentang bagaimana retriever memilih dokumen.

Anda telah disediakan tiga string yang akan digunakan sebagai dasar untuk BM25 retriever Anda. Fungsionalitas yang diperlukan untuk latihan ini sudah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Retrieval Augmented Generation (RAG) dengan LangChain

Lihat Kursus

Petunjuk latihan

  • Inisialisasi BM25 retriever dari dokumen; konfigurasikan untuk mengambil tiga dokumen sekaligus.
  • Panggil retriever pada kueri yang disediakan.
  • Cetak konten halaman dari hasil pertama.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

chunks = [
    "RAG stands for Retrieval Augmented Generation.",
    "Graph Retrieval Augmented Generation uses graphs to store and utilize relationships between documents in the retrieval process.",
    "There are different types of RAG architectures; for example, Graph RAG."
]

# Initialize the BM25 retriever
bm25_retriever = ____.from_texts(____)

# Invoke the retriever
results = bm25_retriever.____("Graph RAG")

# Extract the page content from the first result
print("Most Relevant Document:")
print(____)
Edit dan Jalankan Kode