1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Retrieval Augmented Generation (RAG) with LangChain

Connected

Cvičení

Embedding a ukládání dokumentů

Posledním krokem při přípravě dokumentů pro vyhledávání je jejich embedding a uložení. K vytvoření embeddingů rozdělených dokumentů použiješ model text-embedding-3-small od OpenAI a uložíš je do lokální vektorové databáze Chroma.

chunks vytvořené rekurzivním rozdělením článku Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks jsou již předem načteny.

Vytváření a použití OpenAI API klíče v tomto cvičení není potřeba. Zástupný symbol <OPENAI_API_TOKEN> můžeš ponechat beze změny — požadavky na OpenAI API budou fungovat správně.

Pokyny

100 XP
  • Inicializuj výchozí embedding model od OpenAI.
  • Vytvoř embeddingy chunks dokumentů pomocí embedding_model a ulož je do vektorové databáze Chroma.