Erste SchritteKostenlos loslegen

Hinzufügen von Daten zur Sammlung

Es ist an der Zeit, diese Netflix-Filme und TV -Sendungen zu deiner Sammlung hinzuzufügen! Du hast eine Liste von Dokument-IDs und Texten erhalten, die in ids bzw. documents gespeichert sind und mit folgendem Code extrahiert wurden netflix_titles.csv mit folgendem Code extrahiert wurden:

ids = []
documents = []

with open('netflix_titles.csv') as csvfile:

  reader = csv.DictReader(csvfile)

  for i, row in enumerate(reader):

    ids.append(row['show_id'])

    text = f"Title: {row['title']} ({row['type']})

Description: {row['description']}
Categories: {row['listed_in']}"

    documents.append(text)

Als Beispiel dafür, welche Informationen eingebettet werden, ist hier das erste Dokument von documents:

Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries

Alle notwendigen Funktionen und Pakete wurden importiert und ein persistenter Client wurde erstellt und client zugewiesen.

Diese Übung ist Teil des Kurses

Einführung in Embeddings mit der OpenAI API

Kurs anzeigen

Anleitung zur Übung

  • Erstelle deine netflix_titles Sammlung neu.
  • Füge die Dokumente und ihre IDs zu der Sammlung hinzu.
  • Drucke die Anzahl der Dokumente in collection und die ersten zehn Positionen.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Recreate the netflix_titles collection
collection = client.____(
  name="netflix_titles",
  embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)

# Add the documents and IDs to the collection
____

# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")
Bearbeiten und Ausführen von Code