Como começar a usar o ChromaDB
Nos exercícios a seguir, você usará um banco de dados vetorial para incorporar e consultar 1.000 filmes e TV programas do conjunto de dados da Netflix apresentado no vídeo. O objetivo será usar esses dados para gerar recomendações com base em uma consulta de pesquisa. Para começar, você criará o banco de dados e a coleção para armazenar os dados.
chromadb
está disponível para você usar, e o OpenAIEmbeddingFunction()
foi importado de chromadb.utils.embedding_functions
. Assim como nos dois primeiros capítulos, você não precisa fornecer uma chave OpenAI API neste capítulo.
Este exercício faz parte do curso
Introdução aos embeddings com o OpenAI API
Instruções de exercício
- Crie um cliente persistente para salvar os arquivos de banco de dados no disco; você pode deixar de fora o caminho do arquivo para esses exercícios.
- Crie uma coleção de banco de dados chamada
netflix_titles
que use a função de incorporação OpenAI. - Liste todas as coleções no banco de dados.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create a persistant client
client = chromadb.____()
# Create a netflix_title collection using the OpenAI Embedding function
collection = client.create_collection(
name="____",
____=____(model_name="text-embedding-3-small", api_key="")
)
# List the collections
print(client.____())