LoslegenKostenlos starten

Vorverarbeitete Datensätze speichern

Im Rahmen deines Projekts für einen Customer-Service-Chatbot hast du jetzt einen Datensatz zur Feinabstimmung eines Llama-Modells vorbereitet. Der nächste Schritt ist, den Datensatz zu speichern, damit du ihn später erneut laden kannst, ohne die Vorverarbeitung wiederholen zu müssen. So kann dein Team den Datensatz in mehreren Experimenten und Iterationen wiederverwenden.

Diese Übung ist Teil des Kurses

<Kurs>Feinabstimmung mit Llama 3</Kurs>
Kurs ansehen

Übungsanweisungen

  • Speichere den vorverarbeiteten Datensatz ds auf der Festplatte.
  • Lade den gespeicherten Datensatz in eine neue Variable ds_preprocessed.
  • Gib das erste Element von ds_preprocessed aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from datasets import load_from_disk

# Save the dataset to disk
____

# Load the dataset from disk
ds_preprocessed = ____

# Print the first element of the loaded dataset
print(____)
Code bearbeiten und ausführen