Erste Schritte mit ChromaDB
In den folgenden Übungen verwendest du eine Vektordatenbank, um 1000 Filme und TV Shows aus dem im Video vorgestellten Netflix-Datensatz einzubetten und abzufragen. Das Ziel ist es, diese Daten zu nutzen, um Empfehlungen auf der Grundlage einer Suchanfrage zu erstellen. Um loszulegen, erstellst du die Datenbank und die Sammlung, um die Daten zu speichern.
chromadb
steht dir zur Verfügung, und die OpenAIEmbeddingFunction()
wurde von chromadb.utils.embedding_functions
importiert. Wie in den ersten beiden Kapiteln musst du auch in diesem Kapitel keinen OpenAI-API-Schlüssel angeben.
Diese Übung ist Teil des Kurses
Einführung in Embeddings mit der OpenAI API
Anleitung zur Übung
- Erstelle einen persistenten Client, um die Datenbankdateien auf der Festplatte zu speichern; du kannst den Dateipfad für diese Übungen weglassen.
- Erstelle eine Datenbanksammlung namens
netflix_titles
, die die OpenAI-Einbettungsfunktion verwendet. - Liste alle Sammlungen in der Datenbank auf.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create a persistant client
client = chromadb.____()
# Create a netflix_title collection using the OpenAI Embedding function
collection = client.create_collection(
name="____",
____=____(model_name="text-embedding-3-small", api_key="")
)
# List the collections
print(client.____())