Adicionar dados à coleção
É hora de adicionar os filmes da Netflix e os programas do TV à sua coleção! Você recebeu uma lista de documentos IDs e textos, armazenados em ids
e documents
, respectivamente, que foram extraídos de netflix_titles.csv
usando o código a seguir:
ids = []
documents = []
with open('netflix_titles.csv') as csvfile:
reader = csv.DictReader(csvfile)
for i, row in enumerate(reader):
ids.append(row['show_id'])
text = f"Title: {row['title']} ({row['type']})
Description: {row['description']}
Categories: {row['listed_in']}"
documents.append(text)
Como exemplo de quais informações serão incorporadas, aqui está o primeiro documento de documents
:
Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries
Todas as funções e pacotes necessários foram importados, e um cliente persistente foi criado e atribuído a client
.
Este exercício faz parte do curso
Introdução aos embeddings com o OpenAI API
Instruções de exercício
- Recrie sua coleção
netflix_titles
. - Adicione os documentos e seus IDs à coleção.
- Imprima o número de documentos em
collection
e os dez primeiros itens.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Recreate the netflix_titles collection
collection = client.____(
name="netflix_titles",
embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)
# Add the documents and IDs to the collection
____
# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")