Vorverarbeitete Datensätze speichern
Im Rahmen deines Projekts für einen Customer-Service-Chatbot hast du jetzt einen Datensatz zur Feinabstimmung eines Llama-Modells vorbereitet. Der nächste Schritt ist, den Datensatz zu speichern, damit du ihn später erneut laden kannst, ohne die Vorverarbeitung wiederholen zu müssen. So kann dein Team den Datensatz in mehreren Experimenten und Iterationen wiederverwenden.
Diese Übung ist Teil des Kurses
<Kurs>Feinabstimmung mit Llama 3</Kurs>Übungsanweisungen
- Speichere den vorverarbeiteten Datensatz
dsauf der Festplatte. - Lade den gespeicherten Datensatz in eine neue Variable
ds_preprocessed. - Gib das erste Element von
ds_preprocessedaus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
from datasets import load_from_disk
# Save the dataset to disk
____
# Load the dataset from disk
ds_preprocessed = ____
# Print the first element of the loaded dataset
print(____)