Daten zur Collection hinzufügen

Zeit, die Netflix-Filme und -Serien zu deiner Collection hinzuzufügen! Du bekommst eine Liste mit Dokument-IDs und Texten, gespeichert in ids bzw. documents. Diese wurden aus netflix_titles.csv mit folgendem Code extrahiert:

ids = []
documents = []

with open('netflix_titles.csv') as csvfile:
  reader = csv.DictReader(csvfile)
  for i, row in enumerate(reader):
    ids.append(row['show_id'])
    text = f"Title: {row['title']} ({row['type']})\nDescription: {row['description']}\nCategories: {row['listed_in']}"
    documents.append(text)

Als Beispiel für die Informationen, die eingebettet werden, hier das erste Dokument aus documents:

Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries

Alle erforderlichen Funktionen und Pakete wurden importiert, und ein persistenter Client wurde erstellt und client zugewiesen.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Embeddings mit der OpenAI API</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle deine netflix_titles-Collection neu.
Füge die Dokumente und ihre IDs zur Collection hinzu.
Gib die Anzahl der Dokumente in collection und die ersten zehn Elemente aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Recreate the netflix_titles collection
collection = client.____(
  name="netflix_titles",
  embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)

# Add the documents and IDs to the collection
____

# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")

Code bearbeiten und ausführen