LoslegenKostenlos loslegen

Erste Schritte mit ChromaDB

In den folgenden Übungen nutzt du eine Vektordatenbank, um 1.000 Filme und TV-Serien aus dem im Video vorgestellten Netflix-Datensatz zu embedden und abzufragen. Ziel ist es, mithilfe dieser Daten Empfehlungen auf Basis einer Suchanfrage zu generieren. Zum Einstieg erstellst du die Datenbank und die Collection zum Speichern der Daten.

chromadb steht dir zur Verfügung, und die OpenAIEmbeddingFunction() wurde aus chromadb.utils.embedding_functions importiert. Wie in den ersten beiden Kapiteln musst du in diesem Kapitel keinen OpenAI-API-Schlüssel angeben.

Diese Übung ist Teil des Kurses

Einführung in Embeddings mit der OpenAI API

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen persistenten Client, um die Datenbankdateien auf der Festplatte zu speichern; für diese Übungen kannst du den Dateipfad weglassen.
  • Erstelle eine Datenbank-Collection namens netflix_titles, die die OpenAI-Embedding-Funktion verwendet.
  • Liste alle Collections in der Datenbank auf.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a persistant client
client = chromadb.____()

# Create a netflix_title collection using the OpenAI Embedding function
collection = client.create_collection(
    name="____",
    ____=____(model_name="text-embedding-3-small", api_key="")
)

# List the collections
print(client.____())
Code bearbeiten und ausführen