ComenzarEmpieza gratis

Añadir datos a la colección

¡Es hora de añadir esas películas de Netflix y programas de TV a tu colección! Se te ha proporcionado una lista de documentos IDs y textos, almacenados en ids y documents, respectivamente, que se han extraído de netflix_titles.csv utilizando el siguiente código:

ids = []
documents = []

with open('netflix_titles.csv') as csvfile:

  reader = csv.DictReader(csvfile)

  for i, row in enumerate(reader):

    ids.append(row['show_id'])

    text = f"Title: {row['title']} ({row['type']})

Description: {row['description']}
Categories: {row['listed_in']}"

    documents.append(text)

Como ejemplo de la información que se incrustará, aquí tienes el primer documento de documents:

Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries

Se han importado todas las funciones y paquetes necesarios, y se ha creado un cliente persistente asignado a client.

Este ejercicio forma parte del curso

Introducción a las incrustaciones con la OpenAI API

Ver curso

Instrucciones de ejercicio

  • Recrea tu colección netflix_titles.
  • Añade los documentos y sus IDs a la colección.
  • Imprime el número de documentos en collection y los diez primeros elementos.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Recreate the netflix_titles collection
collection = client.____(
  name="netflix_titles",
  embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)

# Add the documents and IDs to the collection
____

# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")
Editar y ejecutar código