Aan de slagGa gratis aan de slag

Vectoren opvragen voor semantisch zoeken

In deze oefening maak je een queryvector van de vraag: 'What is in front of the Notre Dame Main Building?'. Met deze embedded query bevraag je de namespace 'squad_dataset' in de index 'pinecone-datacamp' en geef je de vijf meest vergelijkbare vectoren terug.

Deze oefening maakt deel uit van de cursus

Vector-databases voor embeddings met Pinecone

Cursus bekijken

Oefeninstructies

  • Initialiseer de Pinecone-client met je API-sleutel (de OpenAI-client is beschikbaar als client).
  • Maak een queryvector door de gegeven query te embedden met hetzelfde OpenAI-embeddingmodel dat je gebruikte voor het embedden van de andere vectoren.
  • Voer een query uit op de namespace "squad_dataset" met query_emb en geef de vijf meest vergelijkbare resultaten terug.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Initialize the Pinecone client
pc = Pinecone(api_key="____")
index = pc.Index('pinecone-datacamp')

query = "What is in front of the Notre Dame Main Building?"

# Create the query vector
query_response = ____(
    input=____,
    model="text-embedding-3-small"
)
query_emb = query_response.data[0].embedding

# Query the index and retrieve the top five most similar vectors
retrieved_docs = ____

for result in retrieved_docs['matches']:
    print(f"{result['id']}: {round(result['score'], 2)}")
    print('\n')
Code bewerken en uitvoeren