BaşlayınÜcretsiz Başlayın

Upsert işlemlerini parçalara bölerek toplu yapmak

Bu egzersizde, vektörleri 'datacamp-index' Pinecone index'ine seri şekilde, parti parti (batch) içeri aktarmayı pratik edeceksin.

Önceki egzersizde oluşturduğun chunks() yardımcı fonksiyonu kullanıma hazır:

def chunks(iterable, batch_size=100):
    """A helper function to break an iterable into chunks of size batch_size."""
    it = iter(iterable)
    chunk = tuple(itertools.islice(it, batch_size))
    while chunk:
        yield chunk
        chunk = tuple(itertools.islice(it, batch_size))

Bu egzersiz

Pinecone ile Vektör Veritabanları ve Embeddings

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Pinecone bağlantısını API anahtarınla başlat.
  • vectors içindeki vektörleri 100'lük batch'ler halinde 'datacamp-index' içine upsert et.
  • Bu index'ten betimleyici istatistikleri yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Initialize the Pinecone client with your API key
pc = Pinecone(api_key="____")

index = pc.Index('datacamp-index')

# Upsert vectors in batches of 100
for chunk in ____:
    ____ 

# Retrieve statistics of the connected Pinecone index
print(____)
Kodu Düzenle ve Çalıştır