CommencerCommencer gratuitement

Regroupement des mises à jour par lots

Dans cet exercice, vous allez vous entraîner à ingérer des vecteurs dans l'index Pinecone d''datacamp-index', par séries, lot par lot.

La fonction d'aide chunks() que vous avez créée dans l'exercice précédent est désormais disponible :

def chunks(iterable, batch_size=100):

    """A helper function to break an iterable into chunks of size batch_size."""

    it = iter(iterable)

    chunk = tuple(itertools.islice(it, batch_size))

    while chunk:

        yield chunk

        chunk = tuple(itertools.islice(it, batch_size))

Cet exercice fait partie du cours

Bases de données vectorielles pour les intégrations avec Pinecone

Afficher le cours

Instructions

  • Veuillez initialiser la connexion Pinecone à l'aide de votre clé API.
  • Insérez les vecteurs de vectors par lots de 100 vecteurs dans 'datacamp-index'.
  • Veuillez imprimer les statistiques descriptives de cet index.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize the Pinecone client with your API key
pc = Pinecone(api_key="____")

index = pc.Index('datacamp-index')

# Upsert vectors in batches of 100
for chunk in ____:
    ____ 

# Retrieve statistics of the connected Pinecone index
print(____)
Modifier et exécuter le code