ComenzarEmpieza gratis

Cargar archivos PDF para RAG

Para empezar a implementar Retrieval Augmented Generation (RAG), primero necesitas cargar los documentos a los que accederá el modelo. Estos documentos pueden venir de distintas fuentes, y LangChain ofrece cargadores de documentos para muchas de ellas.

En este ejercicio, usarás un cargador de documentos para cargar un PDF que contiene el artículo "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" de Lewis et al. (2021). Este archivo está disponible como 'rag_paper.pdf'.

Nota: pypdf, una dependencia para cargar documentos PDF en LangChain, ya está instalada.

Este ejercicio forma parte del curso

Retrieval Augmented Generation (RAG) con LangChain

Ver curso

Instrucciones del ejercicio

  • Importa la clase adecuada para cargar documentos PDF en LangChain.
  • Crea un cargador de documentos para 'rag_paper.pdf'.
  • Carga el documento en memoria para ver el contenido del primer documento, o página.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_paper.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Editar y ejecutar código