Raggruppare gli upsert in chunk
In questo esercizio, farai pratica nell’ingestione di vettori nell’indice Pinecone 'datacamp-index' in serie, batch dopo batch.
La funzione di supporto chunks() che hai creato nell’esercizio precedente è disponibile:
def chunks(iterable, batch_size=100):
"""A helper function to break an iterable into chunks of size batch_size."""
it = iter(iterable)
chunk = tuple(itertools.islice(it, batch_size))
while chunk:
yield chunk
chunk = tuple(itertools.islice(it, batch_size))
Questo esercizio fa parte del corso
Database vettoriali per Embeddings con Pinecone
Istruzioni dell'esercizio
- Inizializza la connessione a Pinecone con la tua API key.
- Esegui l’upsert dei vettori in
vectorsin batch da 100 vettori all’interno di'datacamp-index'. - Stampa le statistiche descrittive di questo index.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Initialize the Pinecone client with your API key
pc = Pinecone(api_key="____")
index = pc.Index('datacamp-index')
# Upsert vectors in batches of 100
for chunk in ____:
____
# Retrieve statistics of the connected Pinecone index
print(____)