ComeçarComece gratuitamente

Como começar a usar o ChromaDB

Nos exercícios a seguir, você usará um banco de dados vetorial para incorporar e consultar 1.000 filmes e TV programas do conjunto de dados da Netflix apresentado no vídeo. O objetivo será usar esses dados para gerar recomendações com base em uma consulta de pesquisa. Para começar, você criará o banco de dados e a coleção para armazenar os dados.

chromadb está disponível para você usar, e o OpenAIEmbeddingFunction() foi importado de chromadb.utils.embedding_functions. Assim como nos dois primeiros capítulos, você não precisa fornecer uma chave OpenAI API neste capítulo.

Este exercício faz parte do curso

Introdução aos embeddings com o OpenAI API

Ver Curso

Instruções de exercício

  • Crie um cliente persistente para salvar os arquivos de banco de dados no disco; você pode deixar de fora o caminho do arquivo para esses exercícios.
  • Crie uma coleção de banco de dados chamada netflix_titles que use a função de incorporação OpenAI.
  • Liste todas as coleções no banco de dados.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Create a persistant client
client = chromadb.____()

# Create a netflix_title collection using the OpenAI Embedding function
collection = client.create_collection(
    name="____",
    ____=____(model_name="text-embedding-3-small", api_key="")
)

# List the collections
print(client.____())
Editar e executar código