Vectoren opvragen voor semantisch zoeken
In deze oefening maak je een queryvector van de vraag: 'What is in front of the Notre Dame Main Building?'. Met deze embedded query bevraag je de namespace 'squad_dataset' in de index 'pinecone-datacamp' en geef je de vijf meest vergelijkbare vectoren terug.
Deze oefening maakt deel uit van de cursus
Vector-databases voor embeddings met Pinecone
Oefeninstructies
- Initialiseer de Pinecone-client met je API-sleutel (de OpenAI-client is beschikbaar als
client). - Maak een queryvector door de gegeven
queryte embedden met hetzelfde OpenAI-embeddingmodel dat je gebruikte voor het embedden van de andere vectoren. - Voer een query uit op de namespace
"squad_dataset"metquery_emben geef de vijf meest vergelijkbare resultaten terug.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Initialize the Pinecone client
pc = Pinecone(api_key="____")
index = pc.Index('pinecone-datacamp')
query = "What is in front of the Notre Dame Main Building?"
# Create the query vector
query_response = ____(
input=____,
model="text-embedding-3-small"
)
query_emb = query_response.data[0].embedding
# Query the index and retrieve the top five most similar vectors
retrieved_docs = ____
for result in retrieved_docs['matches']:
print(f"{result['id']}: {round(result['score'], 2)}")
print('\n')