Premiers pas avec ChromaDB

Dans les exercices suivants, vous allez utiliser une base de données vectorielle pour intégrer et interroger 1000 films et séries TV issus du jeu de données Netflix présenté dans la vidéo. L’objectif est d’utiliser ces données pour générer des recommandations à partir d’une requête de recherche. Pour commencer, vous allez créer la base de données et la collection qui stockeront les données.

chromadb est à votre disposition, et OpenAIEmbeddingFunction() a été importée depuis chromadb.utils.embedding_functions. Comme dans les deux premiers chapitres, vous n’avez pas besoin de fournir de clé d’API OpenAI dans ce chapitre.

Cet exercice fait partie du cours

<cours>Introduction aux embeddings avec l’API OpenAI</cours>

Voir le cours

Instructions de l’exercice

Créez un client persistant pour enregistrer les fichiers de base de données sur le disque ; vous pouvez omettre le chemin de fichier pour ces exercices.
Créez une collection de base de données appelée netflix_titles qui utilise la fonction d’embedding OpenAI.
Listez toutes les collections présentes dans la base de données.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create a persistant client
client = chromadb.____()

# Create a netflix_title collection using the OpenAI Embedding function
collection = client.create_collection(
    name="____",
    ____=____(model_name="text-embedding-3-small", api_key="")
)

# List the collections
print(client.____())

Modifier et exécuter le code