Osadzanie i przechowywanie dokumentów

Ostatnim krokiem w przygotowaniu dokumentów do wyszukiwania jest ich osadzenie i przechowanie. Do osadzania podzielonych fragmentów dokumentów użyjesz modelu text-embedding-3-small od OpenAI, a następnie zapiszesz je w lokalnej wektorowej bazie danych Chroma.

Fragmenty chunks powstałe z rekurencyjnego podziału artykułu Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks zostały już wczytane.

W tym ćwiczeniu nie musisz tworzyć ani używać własnego klucza API OpenAI. Możesz pozostawić placeholder <OPENAI_API_TOKEN> — zostanie on użyty do wysłania poprawnych żądań do API OpenAI.

Zainicjalizuj domyślny model osadzania (embeddings) od OpenAI.
Osadź fragmenty dokumentów chunks za pomocą embedding_model i zapisz je w wektorowej bazie danych Chroma.

ćwiczenie

Osadzanie i przechowywanie dokumentów

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie