IniziaInizia gratis

Raggruppare gli upsert in chunk

In questo esercizio, farai pratica nell’ingestione di vettori nell’indice Pinecone 'datacamp-index' in serie, batch dopo batch.

La funzione di supporto chunks() che hai creato nell’esercizio precedente è disponibile:

def chunks(iterable, batch_size=100):
    """A helper function to break an iterable into chunks of size batch_size."""
    it = iter(iterable)
    chunk = tuple(itertools.islice(it, batch_size))
    while chunk:
        yield chunk
        chunk = tuple(itertools.islice(it, batch_size))

Questo esercizio fa parte del corso

Database vettoriali per Embeddings con Pinecone

Visualizza il corso

Istruzioni dell'esercizio

  • Inizializza la connessione a Pinecone con la tua API key.
  • Esegui l’upsert dei vettori in vectors in batch da 100 vettori all’interno di 'datacamp-index'.
  • Stampa le statistiche descrittive di questo index.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Initialize the Pinecone client with your API key
pc = Pinecone(api_key="____")

index = pc.Index('datacamp-index')

# Upsert vectors in batches of 100
for chunk in ____:
    ____ 

# Retrieve statistics of the connected Pinecone index
print(____)
Modifica ed esegui il codice