Vorverarbeitete Datensätze speichern
Im Rahmen deines Projekts für einen Customer-Service-Chatbot hast du jetzt einen Datensatz zur Feinabstimmung eines Llama-Modells vorbereitet. Der nächste Schritt ist, den Datensatz zu speichern, damit du ihn später erneut laden kannst, ohne die Vorverarbeitung wiederholen zu müssen. So kann dein Team den Datensatz in mehreren Experimenten und Iterationen wiederverwenden.
Diese Übung ist Teil des Kurses
Feinabstimmung mit Llama 3
Anleitung zur Übung
- Speichere den vorverarbeiteten Datensatz
dsauf der Festplatte. - Lade den gespeicherten Datensatz in eine neue Variable
ds_preprocessed. - Gib das erste Element von
ds_preprocessedaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from datasets import load_from_disk
# Save the dataset to disk
____
# Load the dataset from disk
ds_preprocessed = ____
# Print the first element of the loaded dataset
print(____)