Memahami BM25
Sebelum Anda mulai mengintegrasikan BM25 sparse retriever ke dalam arsitektur RAG Anda, sebaiknya uji terlebih dahulu pada beberapa string pendek untuk mendapatkan intuisi tentang bagaimana retriever memilih dokumen.
Anda telah disediakan tiga string yang akan digunakan sebagai dasar untuk BM25 retriever Anda. Fungsionalitas yang diperlukan untuk latihan ini sudah dimuat untuk Anda.
Latihan ini merupakan bagian dari kursus
Retrieval Augmented Generation (RAG) dengan LangChain
Instruksi latihan
- Inisialisasi BM25 retriever dari dokumen; konfigurasikan untuk mengambil tiga dokumen sekaligus.
- Panggil retriever pada kueri yang disediakan.
- Cetak konten halaman dari hasil pertama.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
chunks = [
"RAG stands for Retrieval Augmented Generation.",
"Graph Retrieval Augmented Generation uses graphs to store and utilize relationships between documents in the retrieval process.",
"There are different types of RAG architectures; for example, Graph RAG."
]
# Initialize the BM25 retriever
bm25_retriever = ____.from_texts(____)
# Invoke the retriever
results = bm25_retriever.____("Graph RAG")
# Extract the page content from the first result
print("Most Relevant Document:")
print(____)