ComeçarComece gratuitamente

Adicionar dados à coleção

É hora de adicionar os filmes da Netflix e os programas do TV à sua coleção! Você recebeu uma lista de documentos IDs e textos, armazenados em ids e documents, respectivamente, que foram extraídos de netflix_titles.csv usando o código a seguir:

ids = []
documents = []

with open('netflix_titles.csv') as csvfile:

  reader = csv.DictReader(csvfile)

  for i, row in enumerate(reader):

    ids.append(row['show_id'])

    text = f"Title: {row['title']} ({row['type']})

Description: {row['description']}
Categories: {row['listed_in']}"

    documents.append(text)

Como exemplo de quais informações serão incorporadas, aqui está o primeiro documento de documents:

Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries

Todas as funções e pacotes necessários foram importados, e um cliente persistente foi criado e atribuído a client.

Este exercício faz parte do curso

Introdução aos embeddings com o OpenAI API

Ver Curso

Instruções de exercício

  • Recrie sua coleção netflix_titles.
  • Adicione os documentos e seus IDs à coleção.
  • Imprima o número de documentos em collection e os dez primeiros itens.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Recreate the netflix_titles collection
collection = client.____(
  name="netflix_titles",
  embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)

# Add the documents and IDs to the collection
____

# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")
Editar e executar código