Eine Suchfunktion erstellen

Ein wichtiger Schritt beim Retrieval Augmented Generation (RAG)-Workflow ist das Abrufen von Daten aus der Datenbank. In dieser Übung entwirfst du eine benutzerdefinierte Funktion namens „ retrieve() “, die diesen wichtigen Prozess in der letzten Übung des Kurses ausführt.

Diese Übung ist Teil des Kurses

Vektordatenbanken für Einbettungen mit Pinecone

Anleitung zur Übung

Starte den Pinecone-Client mit deinem API-Schlüssel (der OpenAI-Client ist unter client verfügbar).
Definiere die Funktion „ retrieve “, die vier Parameter nimmt: „ query “, „ top_k “, „ namespace “ und „ emb_model “.
Füge den Eingabe- query mit dem Argument „ emb_model “ ein.
Ruf die Vektoren ab, die ähnlich sind wie top_k und query_emb, zusammen mit den Metadaten, und gib dabei die Funktion namespace als Argument an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Initialize the Pinecone client
pc = Pinecone(api_key="____")
index = pc.Index('pinecone-datacamp')

# Define a retrieve function that takes four arguments: query, top_k, namespace, and emb_model
def retrieve(query, top_k, namespace, emb_model):
    # Encode the input query using OpenAI
    query_response = ____(
        input=____,
        model=____
    )
    
    query_emb = query_response.data[0].embedding
    
    # Query the index using the query_emb
    docs = index.query(vector=____, top_k=____, namespace=____, include_metadata=True)
    
    retrieved_docs = []
    sources = []
    for doc in docs['matches']:
        retrieved_docs.append(doc['metadata']['text'])
        sources.append((doc['metadata']['title'], doc['metadata']['url']))
    
    return retrieved_docs, sources

documents, sources = retrieve(
  query="How to build next-level Q&A with OpenAI",
  top_k=3,
  namespace='youtube_rag_dataset',
  emb_model="text-embedding-3-small"
)
print(documents)
print(sources)

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Vektordatenbanken für Einbettungen mit Pinecone

Mittlere SchwierigkeitSchwierigkeitsgrad

4.8+

Kurs kostenlos starten

Schau dir mal an, wie die Vektordatenbank von Pinecone funktioniert, von Pods und Indizes bis hin zum Vergleich mit anderen Datenbanken. Lerne, Pod-Typen zu unterscheiden, API-Schlüssel zu bekommen und die Pinecone-Verbindung mit Python einzurichten. Zum Schluss lernst du, wie du Pinecone-Indizes erstellst und dabei verschiedene Parameter wie Dimensionalität, Distanzmetriken, Pod-Typen und andere erkundest.

Exercise 1: Einführung in Pinecone-Indizes Exercise 2: Einen Pinecone-Client erstellen Exercise 3: Dein erster Pinecone-Index Exercise 4: Indizes verwalten Exercise 5: Verbindung zu einem Index herstellen Exercise 6: Löschen eines Index Exercise 7: Das Pinecone-Ökosystem Exercise 8: Vektoraufnahme Exercise 9: Überprüfen der Dimensionalität Exercise 10: Vektoren mit Metadaten einlesen

Probier Pinecone in Python aus, wo wir zeigen, wie man Pinecone zum Verwalten von Indizes, Hinzufügen von Vektoren mit Metadaten, Suchen und Abrufen von Vektoren sowie zum Aktualisieren oder Löschen nutzt. Hol dir ein solides Verständnis der wichtigsten Funktionen und Konzepte, um Daten in der Pinecone-Vektordatenbank reibungslos zu verarbeiten.

Exercise 1: Vektoren abrufen Exercise 2: Abfragen vs. Abrufen Exercise 3: Vektoren abrufen Exercise 4: Vektoren abfragen Exercise 5: Die ähnlichsten Vektoren zurückgeben Exercise 6: Ändern der Entfernungsmessung Exercise 7: Metadaten-Filterung Exercise 8: Abfragen filtern Exercise 9: Mehrere Metadatenfilter Exercise 10: Vektoren aktualisieren und löschen Exercise 11: Vektorwerte aktualisieren Exercise 12: Vektormetadaten aktualisieren Exercise 13: Vektoren löschen

In diesem Kapitel lernen die Teilnehmer, wie man die Leistung des Pinecone-Index optimiert, Multi-Tenant-Namespaces zur Kostensenkung nutzt, semantische Suchmaschinen baut und mit Pinecone und der OpenAI-API Frage-Antwort-Systeme mit erweiterter Suche erstellt. In diesen Lektionen lernen die Teilnehmer praktische Fähigkeiten in den Bereichen Performance-Optimierung, semantische Suche und durch Abfrageerweiterung verbesserte Beantwortung von Fragen, sodass sie Pinecone effektiv in echten KI-Anwendungen einsetzen können.

Exercise 1: Upserts stapeln Exercise 2: Eine Funktion für das Chunking festlegen Exercise 3: Upserts in Blöcken zusammenfassen Exercise 4: Parallele Batching-Upserts Exercise 5: Mehrmandantenfähigkeit und Namensräume Exercise 6: Namensräume Exercise 7: Namensräume abfragen Exercise 8: Semantische Suche mit Pinecone Exercise 9: Erstellen und Konfigurieren eines Pinecone-Index Exercise 10: Vektoren für die semantische Suche hochladen Exercise 11: Vektoren für die semantische Suche abfragen Exercise 12: RAG-Chatbot mit Pinecone und OpenAI Exercise 13: YouTube-Transkripte hochladen Exercise 14: Eine Suchfunktion erstellen

Aktuelle Übung

Exercise 15: RAG-Fragen-Antwort-Funktion Exercise 16: Glückwunsch!