Upsert işlemlerini parçalara bölerek toplu yapmak
Bu egzersizde, vektörleri 'datacamp-index' Pinecone index'ine seri şekilde, parti parti (batch) içeri aktarmayı pratik edeceksin.
Önceki egzersizde oluşturduğun chunks() yardımcı fonksiyonu kullanıma hazır:
def chunks(iterable, batch_size=100):
"""A helper function to break an iterable into chunks of size batch_size."""
it = iter(iterable)
chunk = tuple(itertools.islice(it, batch_size))
while chunk:
yield chunk
chunk = tuple(itertools.islice(it, batch_size))
Bu egzersiz
Pinecone ile Vektör Veritabanları ve Embeddings
kursunun bir parçasıdırEgzersiz talimatları
- Pinecone bağlantısını API anahtarınla başlat.
vectorsiçindeki vektörleri 100'lük batch'ler halinde'datacamp-index'içine upsert et.- Bu index'ten betimleyici istatistikleri yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize the Pinecone client with your API key
pc = Pinecone(api_key="____")
index = pc.Index('datacamp-index')
# Upsert vectors in batches of 100
for chunk in ____:
____
# Retrieve statistics of the connected Pinecone index
print(____)