Încorporarea și stocarea documentelor

Ultimul pas pentru pregătirea documentelor în vederea regăsirii este încorporarea și stocarea acestora. Vei folosi modelul text-embedding-3-small de la OpenAI pentru a încorpora fragmentele de documente, pe care le vei stoca într-o bază de date vectorială Chroma locală.

chunks obținute prin împărțirea recursivă a lucrării Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks au fost preîncărcate.

Crearea și utilizarea unui API key OpenAI nu este necesară în acest exercițiu. Poți lăsa placeholder-ul <OPENAI_API_TOKEN> — acesta va trimite cereri valide către API-ul OpenAI.

Inițializează modelul de încorporare (embeddings) implicit de la OpenAI.
Încorporează fragmentele de documente (chunks) folosind embedding_model și stochează-le într-o bază de date vectorială Chroma.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}exercițiu

Instrucțiuni

exercițiu