Comprendre BM25
Avant d’intégrer un récupérateur clairsemé BM25 dans votre architecture RAG, il est préférable de le tester sur quelques chaînes courtes pour vous faire une idée de la façon dont le récupérateur sélectionne les documents.
On vous a fourni trois chaînes que vous utiliserez comme base pour votre récupérateur BM25. Les fonctionnalités nécessaires pour cet exercice sont déjà chargées pour vous.
Cet exercice fait partie du cours
Retrieval Augmented Generation (RAG) avec LangChain
Instructions
- Initialisez le récupérateur BM25 à partir des documents, en le configurant pour récupérer trois documents à la fois.
- Appelez le récupérateur avec la requête fournie.
- Affichez le contenu de page du premier résultat.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
chunks = [
"RAG stands for Retrieval Augmented Generation.",
"Graph Retrieval Augmented Generation uses graphs to store and utilize relationships between documents in the retrieval process.",
"There are different types of RAG architectures; for example, Graph RAG."
]
# Initialize the BM25 retriever
bm25_retriever = ____.from_texts(____)
# Invoke the retriever
results = bm25_retriever.____("Graph RAG")
# Extract the page content from the first result
print("Most Relevant Document:")
print(____)