CommencerCommencer gratuitement

Chargeurs de documents PDF

Pour commencer à mettre en œuvre la Génération à enrichissement contextuel (RAG), vous devez d'abord charger les documents auxquels le modèle aura accès. Ces documents peuvent provenir de diverses sources, et LangChain prend en charge les chargeurs de documents pour la plupart d'entre elles.

Dans cet exercice, vous utiliserez un chargeur de documents pour charger un document PDF contenant l'article, RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture par Balaguer et al. (2024).

Remarque : pypdf, une dépendance nécessaire au chargement des documents PDF dans LangChain, a déjà été installée pour vous.

Cet exercice fait partie du cours

Développement d'applications LLM avec LangChain

Afficher le cours

Instructions

  • Importez la classe appropriée pour charger les documents PDF dans LangChain.
  • Créez un chargeur de document pour le document 'rag_vs_fine_tuning.pdf', disponible dans le répertoire actuel.
  • Chargez le document en mémoire pour afficher le contenu du premier document ou de la première page.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Modifier et exécuter le code