1. Nauka
  2. /
  3. Kursy
  4. /
  5. Retrieval Augmented Generation (RAG) z LangChain

Connected

ćwiczenie

Osadzanie i przechowywanie dokumentów

Ostatnim krokiem w przygotowaniu dokumentów do wyszukiwania jest ich osadzenie i przechowanie. Do osadzania podzielonych fragmentów dokumentów użyjesz modelu text-embedding-3-small od OpenAI, a następnie zapiszesz je w lokalnej wektorowej bazie danych Chroma.

Fragmenty chunks powstałe z rekurencyjnego podziału artykułu Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks zostały już wczytane.

W tym ćwiczeniu nie musisz tworzyć ani używać własnego klucza API OpenAI. Możesz pozostawić placeholder <OPENAI_API_TOKEN> — zostanie on użyty do wysłania poprawnych żądań do API OpenAI.

Instrukcje

100 XP
  • Zainicjalizuj domyślny model osadzania (embeddings) od OpenAI.
  • Osadź fragmenty dokumentów chunks za pomocą embedding_model i zapisz je w wektorowej bazie danych Chroma.