1. Learn
  2. /
  3. कोर्स
  4. /
  5. Pinecone के साथ Embeddings के लिए Vector Databases

Connected

अभ्यास

Semantic search के लिए वेक्टर upsert करना

अब समय है कुछ टेक्स्ट डेटा को embed करने और वेक्टर तथा मेटाडेटा को आपके 'pinecone-datacamp' इंडेक्स में upsert करने का! आपको squad_dataset.csv नाम का एक डेटासेट दिया गया है, और 200 rows का एक sample DataFrame df में लोड किया गया है.

इस अभ्यास में, OpenAI API से उनके embedding मॉडल का उपयोग करने के लिए, आपको अपना API key बनाने या इस्तेमाल करने की ज़रूरत नहीं है। आपके लिए एक वैध OpenAI client बना दिया गया है और उसे client वैरिएबल में असाइन किया गया है.

आपका कार्य है OpenAI की API का उपयोग करके टेक्स्ट को embed करना और embeddings तथा मेटाडेटा को Pinecone इंडेक्स में squad_dataset namespace के तहत upsert करना.

निर्देश

100 XP
  • Pinecone client को अपने API key के साथ initialize करें (OpenAI client पहले से client के रूप में उपलब्ध है).
  • बैच की प्रत्येक row से 'id', 'text', और 'title' मेटाडेटा निकालें.
  • OpenAI के 'text-embedding-3-small' से texts को dimensionality 1536 के साथ encode करें.
  • वेक्टर और metadatas को 'squad_dataset' नामक namespace में upsert करें.