LoslegenKostenlos loslegen

Vorverarbeitete Datensätze speichern

Im Rahmen deines Projekts für einen Customer-Service-Chatbot hast du jetzt einen Datensatz zur Feinabstimmung eines Llama-Modells vorbereitet. Der nächste Schritt ist, den Datensatz zu speichern, damit du ihn später erneut laden kannst, ohne die Vorverarbeitung wiederholen zu müssen. So kann dein Team den Datensatz in mehreren Experimenten und Iterationen wiederverwenden.

Diese Übung ist Teil des Kurses

Feinabstimmung mit Llama 3

Kurs anzeigen

Anleitung zur Übung

  • Speichere den vorverarbeiteten Datensatz ds auf der Festplatte.
  • Lade den gespeicherten Datensatz in eine neue Variable ds_preprocessed.
  • Gib das erste Element von ds_preprocessed aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from datasets import load_from_disk

# Save the dataset to disk
____

# Load the dataset from disk
ds_preprocessed = ____

# Print the first element of the loaded dataset
print(____)
Code bearbeiten und ausführen