1. Apprendre
  2. /
  3. Cours
  4. /
  5. Génération augmentée par la recherche (RAG) avec LangChain

Connected

Exercice

Encoder et stocker des documents

La dernière étape de préparation des documents pour la recherche consiste à les encoder (embeddings) et à les stocker. Vous utiliserez le modèle text-embedding-3-small d'OpenAI pour encoder les documents segmentés et les enregistrer dans une base de données vectorielle Chroma locale.

Les chunks que vous avez créés en découpant récursivement l'article Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks ont été préchargés.

La création et l'utilisation d'une clé d'API OpenAI ne sont pas requises dans cet exercice. Vous pouvez laisser l'espace réservé <OPENAI_API_TOKEN>, ce qui enverra des requêtes valides à l'API d'OpenAI.

Instructions

100 XP
  • Initialisez le modèle d'embeddings par défaut d'OpenAI.
  • Encodez les chunks du document avec embedding_model et stockez-les dans une base de données vectorielle Chroma.