CommencerCommencer gratuitement

Ajouter des données à la collection

Il est temps d'ajouter ces films Netflix et ces émissions TV à votre collection ! On vous a fourni une liste d'identifiants de documents et de textes, stockés respectivement dans ids et documents, qui ont été extraits de netflix_titles.csv à l'aide du code suivant :

ids = []
documents = []

with open('netflix_titles.csv') as csvfile:

  reader = csv.DictReader(csvfile)

  for i, row in enumerate(reader):

    ids.append(row['show_id'])

    text = f"Title: {row['title']} ({row['type']})

Description: {row['description']}
Categories: {row['listed_in']}"

    documents.append(text)

Pour illustrer les informations qui seront intégrées, voici le premier document provenant de documents:

Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries

Toutes les fonctions et tous les paquets nécessaires ont été importés, et un client persistant a été créé et attribué à client.

Cet exercice fait partie du cours

Introduction à l'intégration avec l'API OpenAI

Afficher le cours

Instructions

  • Recréez votre collection netflix_titles.
  • Ajoutez les documents et leurs identifiants à la collection.
  • Imprimez le nombre de documents sur collection et les dix premiers éléments.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Recreate the netflix_titles collection
collection = client.____(
  name="netflix_titles",
  embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)

# Add the documents and IDs to the collection
____

# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")
Modifier et exécuter le code