LoslegenKostenlos starten

Daten zur Collection hinzufügen

Zeit, die Netflix-Filme und -Serien zu deiner Collection hinzuzufügen! Du bekommst eine Liste mit Dokument-IDs und Texten, gespeichert in ids bzw. documents. Diese wurden aus netflix_titles.csv mit folgendem Code extrahiert:

ids = []
documents = []

with open('netflix_titles.csv') as csvfile:
  reader = csv.DictReader(csvfile)
  for i, row in enumerate(reader):
    ids.append(row['show_id'])
    text = f"Title: {row['title']} ({row['type']})\nDescription: {row['description']}\nCategories: {row['listed_in']}"
    documents.append(text)

Als Beispiel für die Informationen, die eingebettet werden, hier das erste Dokument aus documents:

Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries

Alle erforderlichen Funktionen und Pakete wurden importiert, und ein persistenter Client wurde erstellt und client zugewiesen.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Embeddings mit der OpenAI API</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle deine netflix_titles-Collection neu.
  • Füge die Dokumente und ihre IDs zur Collection hinzu.
  • Gib die Anzahl der Dokumente in collection und die ersten zehn Elemente aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Recreate the netflix_titles collection
collection = client.____(
  name="netflix_titles",
  embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)

# Add the documents and IDs to the collection
____

# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")
Code bearbeiten und ausführen