1. Apprendre
  2. /
  3. Cours
  4. /
  5. Génération augmentée par la recherche (RAG) avec LangChain

Connected

Exercice

Charger des fichiers PDF pour le RAG

Pour commencer à mettre en œuvre le Retrieval Augmented Generation (RAG), vous devez d'abord charger les documents auxquels le modèle aura accès. Ces documents peuvent provenir de diverses sources, et LangChain prend en charge des chargeurs de documents pour plusieurs d'entre elles.

Dans cet exercice, vous utiliserez un chargeur de documents pour charger un PDF contenant l'article « Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks » de Lewis et al. (2021). Ce fichier est fourni sous le nom 'rag_paper.pdf'.

Remarque : pypdf, une dépendance nécessaire pour charger des documents PDF dans LangChain, a déjà été installée pour vous.

Instructions

100 XP
  • Importez la classe appropriée pour charger des documents PDF dans LangChain.
  • Créez un chargeur de documents pour le fichier 'rag_paper.pdf'.
  • Chargez le document en mémoire afin d'afficher le contenu du premier document, ou de la première page.