1. Learn
  2. /
  3. Курси
  4. /
  5. Vector Databases for Embeddings with Pinecone

Connected

вправа

Upsert векторів для семантичного пошуку

Час створити вкладення (embeddings — векторні представлення) для текстових даних і додати вектори та метадані до вашого індексу 'pinecone-datacamp'! Вам надано набір даних squad_dataset.csv, а вибірку з 200 рядків завантажено в датафрейм df.

У цій вправі, щоб працювати з OpenAI API та використати їхню модель для створення вкладень, вам не потрібно створювати й використовувати власний ключ API. Для вас уже створено чинний клієнт OpenAI і присвоєно змінній client.

Ваше завдання — отримати вкладення тексту за допомогою API OpenAI та виконати upsert вкладень і метаданих в індекс Pinecone в просторі імен squad_dataset.

Інструкції

100 XP
  • Ініціалізуйте клієнт Pinecone із вашим ключем API (клієнт OpenAI уже доступний як client).
  • Витягніть метадані 'id', 'text' і 'title' з кожного row у пакеті.
  • Закодуйте texts, використовуючи модель OpenAI 'text-embedding-3-small' із розмірністю 1536.
  • Виконайте upsert векторів і метаданих у простір імен 'squad_dataset'.