Hinzufügen von Daten zur Sammlung
Es ist an der Zeit, diese Netflix-Filme und TV -Sendungen zu deiner Sammlung hinzuzufügen! Du hast eine Liste von Dokument-IDs und Texten erhalten, die in ids
bzw. documents
gespeichert sind und mit folgendem Code extrahiert wurden netflix_titles.csv
mit folgendem Code extrahiert wurden:
ids = []
documents = []
with open('netflix_titles.csv') as csvfile:
reader = csv.DictReader(csvfile)
for i, row in enumerate(reader):
ids.append(row['show_id'])
text = f"Title: {row['title']} ({row['type']})
Description: {row['description']}
Categories: {row['listed_in']}"
documents.append(text)
Als Beispiel dafür, welche Informationen eingebettet werden, ist hier das erste Dokument von documents
:
Title: Dick Johnson Is Dead (Movie)
Description: As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.
Categories: Documentaries
Alle notwendigen Funktionen und Pakete wurden importiert und ein persistenter Client wurde erstellt und client
zugewiesen.
Diese Übung ist Teil des Kurses
Einführung in Embeddings mit der OpenAI API
Anleitung zur Übung
- Erstelle deine
netflix_titles
Sammlung neu. - Füge die Dokumente und ihre IDs zu der Sammlung hinzu.
- Drucke die Anzahl der Dokumente in
collection
und die ersten zehn Positionen.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Recreate the netflix_titles collection
collection = client.____(
name="netflix_titles",
embedding_function=OpenAIEmbeddingFunction(model_name="text-embedding-3-small", api_key="")
)
# Add the documents and IDs to the collection
____
# Print the collection size and first ten items
print(f"No. of documents: {____}")
print(f"First ten documents: {____}")