ComenzarEmpieza gratis

PDF cargadores de documentos

Para empezar a aplicar la Generación Aumentada de Recuperación (RAG), primero tendrás que cargar los documentos a los que accederá el modelo. Estos documentos pueden proceder de diversas fuentes, y LangChain admite cargadores de documentos para muchas de ellas.

En este ejercicio, utilizarás un cargador de documentos para cargar un documento PDF que contenga el papel, RAG VS Ajuste fino: Pipelines, Tradeoffs, and a Case Study on Agriculture por Balaguer et al. (2024).

Nota: pypdf, una dependencia para cargar documentos PDF en LangChain, ya ha sido instalada para ti.

Este ejercicio forma parte del curso

Desarrollar aplicaciones LLM con LangChain

Ver curso

Instrucciones de ejercicio

  • Importa la clase adecuada para cargar documentos PDF en LangChain.
  • Crea un cargador de documentos para el documento 'rag_vs_fine_tuning.pdf', que está disponible en el directorio actual.
  • Carga el documento en la memoria para ver el contenido del primer documento, o página.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Editar y ejecutar código