Primeros pasos con ChromaDB
En los siguientes ejercicios, utilizarás una base de datos vectorial para incrustar y consultar 1000 películas y TV programas del conjunto de datos de Netflix introducido en el vídeo. El objetivo será utilizar estos datos para generar recomendaciones basadas en una consulta de búsqueda. Para empezar, crearás la base de datos y la colección para almacenar los datos.
chromadb
está disponible para que lo utilices, y el OpenAIEmbeddingFunction()
se ha importado de chromadb.utils.embedding_functions
. Al igual que en los dos primeros capítulos, en este capítulo no necesitas proporcionar una clave de OpenAI API.
Este ejercicio forma parte del curso
Introducción a las incrustaciones con la OpenAI API
Instrucciones del ejercicio
- Crea un cliente persistente para guardar los archivos de la base de datos en el disco; puedes omitir la ruta del archivo para estos ejercicios.
- Crea una colección de base de datos llamada
netflix_titles
que utilice la función de incrustación de OpenAI. - Enumera todas las colecciones de la base de datos.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Create a persistant client
client = chromadb.____()
# Create a netflix_title collection using the OpenAI Embedding function
collection = client.create_collection(
name="____",
____=____(model_name="text-embedding-3-small", api_key="")
)
# List the collections
print(client.____())