Regroupement des mises à jour par lots
Dans cet exercice, vous allez vous entraîner à ingérer des vecteurs dans l'index Pinecone d''datacamp-index', par séries, lot par lot.
La fonction d'aide chunks() que vous avez créée dans l'exercice précédent est désormais disponible :
def chunks(iterable, batch_size=100):
"""A helper function to break an iterable into chunks of size batch_size."""
it = iter(iterable)
chunk = tuple(itertools.islice(it, batch_size))
while chunk:
yield chunk
chunk = tuple(itertools.islice(it, batch_size))
Cet exercice fait partie du cours
Bases de données vectorielles pour les intégrations avec Pinecone
Instructions
- Veuillez initialiser la connexion Pinecone à l'aide de votre clé API.
- Insérez les vecteurs de
vectorspar lots de 100 vecteurs dans'datacamp-index'. - Veuillez imprimer les statistiques descriptives de cet index.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Initialize the Pinecone client with your API key
pc = Pinecone(api_key="____")
index = pc.Index('datacamp-index')
# Upsert vectors in batches of 100
for chunk in ____:
____
# Retrieve statistics of the connected Pinecone index
print(____)