Premiers pas avec ChromaDB
Dans les exercices suivants, vous allez utiliser une base de données vectorielle pour intégrer et interroger 1000 films et séries TV issus du jeu de données Netflix présenté dans la vidéo. L’objectif est d’utiliser ces données pour générer des recommandations à partir d’une requête de recherche. Pour commencer, vous allez créer la base de données et la collection qui stockeront les données.
chromadb est à votre disposition, et OpenAIEmbeddingFunction() a été importée depuis chromadb.utils.embedding_functions. Comme dans les deux premiers chapitres, vous n’avez pas besoin de fournir de clé d’API OpenAI dans ce chapitre.
Cet exercice fait partie du cours
Introduction aux embeddings avec l’API OpenAI
Instructions
- Créez un client persistant pour enregistrer les fichiers de base de données sur le disque ; vous pouvez omettre le chemin de fichier pour ces exercices.
- Créez une collection de base de données appelée
netflix_titlesqui utilise la fonction d’embedding OpenAI. - Listez toutes les collections présentes dans la base de données.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a persistant client
client = chromadb.____()
# Create a netflix_title collection using the OpenAI Embedding function
collection = client.create_collection(
name="____",
____=____(model_name="text-embedding-3-small", api_key="")
)
# List the collections
print(client.____())