ComenzarEmpieza gratis

Entendiendo BM25

Antes de integrar un recuperador disperso BM25 en tu arquitectura RAG, conviene probarlo con algunas cadenas cortas para coger intuición sobre cómo selecciona los documentos.

Se te han proporcionado tres cadenas que usarás como base para tu recuperador BM25. La funcionalidad necesaria para este ejercicio ya está cargada.

Este ejercicio forma parte del curso

Retrieval Augmented Generation (RAG) con LangChain

Ver curso

Instrucciones del ejercicio

  • Inicializa el recuperador BM25 a partir de los documentos, configurándolo para recuperar tres documentos a la vez.
  • Invoca el recuperador con la consulta proporcionada.
  • Imprime el contenido de la primera página del primer resultado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

chunks = [
    "RAG stands for Retrieval Augmented Generation.",
    "Graph Retrieval Augmented Generation uses graphs to store and utilize relationships between documents in the retrieval process.",
    "There are different types of RAG architectures; for example, Graph RAG."
]

# Initialize the BM25 retriever
bm25_retriever = ____.from_texts(____)

# Invoke the retriever
results = bm25_retriever.____("Graph RAG")

# Extract the page content from the first result
print("Most Relevant Document:")
print(____)
Editar y ejecutar código