Daten zur Collection hinzufügen
Zeit, die Netflix-Filme und -Serien zu deiner Collection hinzuzufügen! Du bekommst eine Liste mit Dokument-IDs und Texten, gespeichert in ids bzw. documents. Diese wurden aus netflix_titles.csv mit folgendem Code extrahiert:
ids = []
documents = []
with open('netflix_titles.csv') as csvfile:
reader = csv.DictReader(csvfile)
for i, row in enumerate(reader):
ids.append(row['show_id'])
text = f"Title: {row['title']} ({row['type']})\nDescription: {row['description']}\nCategories: {row['listed_in']}"
documents.append(text)
Als Beispiel für die Informationen, die eingebettet werden, hier das erste Dokument aus documents:
Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries
Alle erforderlichen Funktionen und Pakete wurden importiert, und ein persistenter Client wurde erstellt und client zugewiesen.
Diese Übung ist Teil des Kurses
Einführung in Embeddings mit der OpenAI API
Anleitung zur Übung
- Erstelle deine
netflix_titles-Collection neu. - Füge die Dokumente und ihre IDs zur Collection hinzu.
- Gib die Anzahl der Dokumente in
collectionund die ersten zehn Elemente aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Recreate the netflix_titles collection
collection = client.____(
name="netflix_titles",
embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)
# Add the documents and IDs to the collection
____
# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")