1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wektorowe bazy danych dla osadzeń z Pinecone

Connected

ćwiczenie

Wstawianie wektorów na potrzeby wyszukiwania semantycznego

Czas osadzić dane tekstowe i wstawić wektory wraz z metadanymi do indeksu 'pinecone-datacamp'! Otrzymujesz zbiór danych o nazwie squad_dataset.csv, z którego próbka 200 wierszy została wczytana do ramki danych df.

W tym ćwiczeniu, aby korzystać z API OpenAI i ich modelu osadzania, nie musisz tworzyć ani podawać własnego klucza API. Gotowy klient OpenAI został już utworzony i przypisany do zmiennej client.

Twoim zadaniem jest osadzenie tekstu za pomocą API OpenAI, a następnie wstawienie osadzeń i metadanych do indeksu Pinecone w przestrzeni nazw squad_dataset.

Instrukcje

100 XP
  • Zainicjuj klienta Pinecone za pomocą swojego klucza API (klient OpenAI jest już dostępny jako client).
  • Wyodrębnij metadane 'id', 'text' oraz 'title' z każdego wiersza row w partii.
  • Zakoduj zmienną texts przy użyciu modelu 'text-embedding-3-small' firmy OpenAI z wymiarowością 1536.
  • Wstaw wektory i metadane do przestrzeni nazw o nazwie 'squad_dataset'.