Encoder et stocker des documents

La dernière étape de préparation des documents pour la recherche consiste à les encoder (embeddings) et à les stocker. Vous utiliserez le modèle text-embedding-3-small d'OpenAI pour encoder les documents segmentés et les enregistrer dans une base de données vectorielle Chroma locale.

Les chunks que vous avez créés en découpant récursivement l'article Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks ont été préchargés.

La création et l'utilisation d'une clé d'API OpenAI ne sont pas requises dans cet exercice. Vous pouvez laisser l'espace réservé <OPENAI_API_TOKEN>, ce qui enverra des requêtes valides à l'API d'OpenAI.

Initialisez le modèle d'embeddings par défaut d'OpenAI.
Encodez les chunks du document avec embedding_model et stockez-les dans une base de données vectorielle Chroma.

Exercice

Encoder et stocker des documents

Instructions

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Exercice

Instructions

Exercice