1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vektorové databáze pro embeddingy s Pinecone

Connected

Cvičení

Vkládání vektorů pro sémantické vyhledávání

Čas převést textová data na vektory a vložit je spolu s metadaty do indexu 'pinecone-datacamp'! Máš k dispozici dataset squad_dataset.csv – do DataFrame df byl načten vzorek 200 řádků.

V tomto cvičení nepotřebuješ vytvářet vlastní API klíč pro práci s OpenAI API a jejich embeddovacím modelem. Platný OpenAI klient už je připravený a přiřazený do proměnné client.

Tvým úkolem je převést text na embeddingy pomocí OpenAI API a vložit embeddingy spolu s metadaty do Pinecone indexu v namespace squad_dataset.

Pokyny

100 XP
  • Inicializuj Pinecone klienta pomocí svého API klíče (OpenAI klient je už dostupný jako client).
  • Z každého row v dávce extrahuj metadata 'id', 'text' a 'title'.
  • Zakóduj texts pomocí modelu 'text-embedding-3-small' od OpenAI s dimenzionalitou 1536.
  • Vlož vektory a metadata do namespace s názvem 'squad_dataset'.