Ajouter des données à la collection
Il est temps d’ajouter ces films et séries Netflix à votre collection ! Vous disposez d’une liste d’identifiants de documents et de textes, stockés respectivement dans ids et documents, qui ont été extraits de netflix_titles.csv à l’aide du code suivant :
ids = []
documents = []
with open('netflix_titles.csv') as csvfile:
reader = csv.DictReader(csvfile)
for i, row in enumerate(reader):
ids.append(row['show_id'])
text = f"Title: {row['title']} ({row['type']})\nDescription: {row['description']}\nCategories: {row['listed_in']}"
documents.append(text)
Voici, à titre d’exemple de l’information qui sera encodée, le premier document de documents :
Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries
Toutes les fonctions et tous les packages nécessaires ont été importés, et un client persistant a été créé et affecté à client.
Cet exercice fait partie du cours
Introduction aux embeddings avec l’API OpenAI
Instructions
- Recréez votre collection
netflix_titles. - Ajoutez les documents et leurs identifiants à la collection.
- Affichez le nombre de documents dans
collectionet les dix premiers éléments.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Recreate the netflix_titles collection
collection = client.____(
name="netflix_titles",
embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)
# Add the documents and IDs to the collection
____
# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")