Dimensionaliteit controleren
Je hebt nu de kennis om vectoren in een nieuwe Pinecone-index te gaan laden! Voordat je begint, moet je controleren of je vectoren compatibel zijn met de dimensionaliteit van je nieuwe index.
Een lijst met dictionaries met records om in te laden is beschikbaar als vectors. Hier is een voorbeeld van de structuur:
vectors = [
{
"id": "0",
"values": [0.025525547564029694, ..., 0.0188823901116848]
"metadata": {"genre": "action", "year": 2024}
},
...,
]
Als je per ongeluk een geldige index maakt die niet voldoet aan de specificaties in de instructies, moet je de volgende code toevoegen vóór je .create_index()-code:
pc.delete_index('datacamp-index')
Deze oefening maakt deel uit van de cursus
Vector-databases voor embeddings met Pinecone
Oefeninstructies
- Initialiseer de Pinecone-verbinding met je API-sleutel.
- Maak een nieuwe serverless Pinecone-index met de naam
"datacamp-index"; laat de andere instellingen zoals ze zijn. - Gebruik een list comprehension om te controleren dat elke vector in
vectorslengte1536heeft, en geef éénTrueofFalseterug die aangeeft of ze allemaal aan deze voorwaarde voldoen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Initialize the Pinecone client using your API key
pc = Pinecone(api_key="____")
# Create your Pinecone index
pc.____(
name="____",
dimension=1536,
spec=____(
cloud='aws',
region='us-east-1'
)
)
# Check that each vector has a dimensionality of 1536
vector_dims = [____(vector['____']) == ____ for vector in ____]
print(____(vector_dims))